Genie 3是一款具備生成多樣化交互環境能力的通用世界模型。如今,谷歌通過Project Genie項目,面向美國地區的AI Ultra訂閱用戶開放了這一模型的體驗權限。
世界模型的核心功能在於模擬環境的動態變化,能夠精準預測環境如何演變以及各類行為對其產生的影響。儘管谷歌DeepMind在棋類(如西洋棋、圍棋)等特定環境的人工智慧代理開發方面成績斐然,但構建通用人工智慧(AGI
)需要的是能夠應對現實世界複雜多樣性的系統。Genie 3的出現,正是谷歌在這一領域的重要探索。

這一實驗性研究原型要求用戶首先描述自己設想的環境,比如「你的世界是什麼樣的?」,同時需明確探索方式,包括步行、騎行、飛行、駕駛等,以及選擇第一人稱或第三人稱視角。
用戶還需指定角色類型,例如是人類、動物、物體還是其他形態。完成這些設定後,Project Genie會藉助Nano Banana Pro生成預覽圖像,即「世界草圖」。通過這一功能,用戶可以提前預覽自己即將創建的世界的大致模樣,並根據需求修改圖像,在正式進入世界之前對細節進行精細調整。
接下來進入「創建世界」環節,用戶每次操作限時60秒。所生成的世界具有高度逼真的效果,解析度達到720p,交互幀率保持在每秒20-24幀。當用戶在虛擬世界中移動時,Genie 3會根據用戶的動作實時生成前方的路徑。此外,用戶在與世界交互時可以調整相機視角,並且能夠下載自己漫遊世界的影片。
Genie 3還具備「Remix Worlds」(世界重組)功能,用戶可以基於現有世界的提示詞對其進行重新構建,創造出全新的詮釋。用戶可以在畫廊或隨機生成器圖標中探索精心挑選的世界,從中獲取靈感,也可以直接在這些現有世界的基礎上進行二次創作,進一步豐富自己的虛擬世界體驗。
除了60秒的操作時間限制外,谷歌也提醒用戶,生成的世界可能並非完全逼真,不一定能嚴格遵循提示詞或圖像,也可能不完全符合現實世界的物理規律。同時,角色的控制有時可能不夠精準,控制過程中可能會出現較高的延遲。
不過,谷歌正在努力改進Project Genie,計劃引入「可提示事件」,即根據用戶的探索行為改變世界狀態,以提升用戶體驗。
目前,該體驗權限已開始逐步向美國地區18歲及以上的Google AI Ultra訂閱用戶開放,後續將適時擴展到更多地區。






