
今日,騰訊混元官方宣布,HunyuanWorld-Voyager(簡稱混元Voyager)正式發布,這是業界首個支持原生3D重建的超長漫遊世界模型。
該模型在斯坦福大學李飛飛團隊發布的世界模型基準測試WorldScore上位居綜合能力首位,超越現有開源方法,在影片生成和3D重建任務中均表現出色。
在影片生成和影片3D重建兩個任務上,Voyager也均取得更好的結果。



據介紹,混元Voyager聚焦於AI在空間智能領域的應用擴展,將為虛擬現實、物理仿真、遊戲開發等領域提供高保真的3D場景漫遊能力。
模型突破傳統影片生成在空間一致性和探索範圍上的局限,能夠生成長距離、世界一致的漫遊場景,支持將影片直接導出為3D格式。


據了解,混元Voyager 3D輸入-3D輸出的特性,與此前已開源的混元世界模型1.0高度適配,可進一步擴展1.0模型漫遊範圍,提升複雜場景的生成質量,並可對生成的場景做風格化控制和編輯。
此外,該模型可支持影片場景重建、3D物體紋理生成、影片風格定製化生成、影片深度估計等多種3D理解與生成應用。
官方表示,混元Voyager首次通過空間與特徵結合的方式,支持原生的3D記憶和場景重建,避免了傳統後處理帶來的延遲和精度損失。
同時,在輸入端加入3D條件保證畫面視角精準,輸出端直接生成3D點雲,適配多種應用場景。
額外的深度資訊還能支持影片場景重建、3D物體紋理生成、風格化編輯和深度估計等功能。