
在增强现实和造谣现实鸿沟,它不错通过将圭臬视频转机为让用户仿佛不入虎穴,焉得虎子的千里浸式内容,从而最大化用户体验
(映维网Nweon 2026年02月24日)在看《昏黑骑士》时,要是你不单是看着屏幕里的懦夫,而是实在通过他的眼睛来感受哥谭市,会奈何?这种令你不再是旁不雅者,而是通过变装视角体验寰球的技巧正在成为现实。韩国科学技巧院的接头东谈主员建树出了一种全新的东谈主工智能模子,不错将普通视频素材生成为第一东谈主称视角视频。

跟着增强现实和造谣现实等技巧的快速发展,省略拿获东谈主们获胜所见场景的“第一东谈主称视频”的伏击性日益增长。但将现存的圭臬视频当然地转机为第一东谈主称视角存在紧要的技巧适度。
这项技巧的一个要道特色是,它不单是是浅易地旋转屏幕,而是通过全面贯穿东谈主物的位置、姿态以及周围空间的三维结构来重建第一东谈主称视角。
现存技巧时时只可转机静态图像,或者需要来自四个或更多录像头的视频素材。另外,在光芒复杂或快速迁移的视频中,它们时时会出现不当然的视觉伪影。
比较之下,EgoX是一种诈欺旁不雅者视角视频,精准生成视频中东谈主物现实所见场景的AI模子。它仅需单个第三东谈主称视频源就能生成高质地的第一东谈主称视频。具体来说,OD体育app接头团队通过精准模拟头部通顺与现实视线之间的谈判性,得手罢了了当东谈主物回首时视觉的当然变化。
EgoX通过轻量级的LoRA适配,诈欺大限制视频扩散模子中预历练的时空常识,并引入了一种斡旋的要求计策,通过宽度维和通谈维的拼接来荟萃旁不雅者视角和第一东谈主称视角的先验信息。另外,一种几何指点的自闲逸力机制省略礼聘性地热心空辗转洽区域,确保几何一致性和高视觉保真度。所述式样罢了了连贯且传神的第一东谈主称视角视频生成,同期对未见过的和当然环境下的视频展现出强大的可推广性和鲁棒性。

这项技巧在包括烹调、锻真金不怕火和责任在内的多样日常场景中皆发达出雄厚的性能,不受特定环境的适度。EgoX瞻望将在各个行业产生紧要影响。在增强现实和造谣现实鸿沟,它不错通过将圭臬视频转机为让用户仿佛不入虎穴,焉得虎子的千里浸式内容,从而最大化用户体验。
接头东谈主员暗示:“这项接头的艳羡在于,AI照旧卓绝了浅易的视频转机,投入到学习和重建东谈主类’视觉’和’空间贯穿’的阶段。咱们瞻望,一个仅使用以往录制的视频,任何东谈主皆能创建和体验千里浸式内容的环境将会到来。”
谈判论文:EgoX: Egocentric Video Generation from a Single Exocentric Video
这份接头照旧引起了英伟达和Meta等巨头及学术界的过去热心,并磋磨于2026年6月3日在好意思国科罗拉多州举行的IEEE/CVF计较机视觉与神态识别会议海外学术会议细致宣讲。