谷歌Genie 3通用世界模型向美國AI Ultra訂閱用戶開放體驗

Genie 3是一款具備生成多樣化交互環境能力的通用世界模型。如今，谷歌通過Project Genie項目，面向美國地區的AI Ultra訂閱用戶開放了這一模型的體驗權限。

贊助商廣告

世界模型的核心功能在於模擬環境的動態變化，能夠精準預測環境如何演變以及各類行為對其產生的影響。儘管谷歌DeepMind在棋類（如西洋棋、圍棋）等特定環境的人工智慧代理開發方面成績斐然，但構建通用人工智慧（AGI 谷歌Genie3通用世界模型向美國AIUltra訂閱用戶開放體驗）需要的是能夠應對現實世界複雜多樣性的系統。Genie 3的出現，正是谷歌在這一領域的重要探索。

這一實驗性研究原型要求用戶首先描述自己設想的環境，比如「你的世界是什麼樣的？」，同時需明確探索方式，包括步行、騎行、飛行、駕駛等，以及選擇第一人稱或第三人稱視角。

用戶還需指定角色類型，例如是人類、動物、物體還是其他形態。完成這些設定後，Project Genie會藉助Nano Banana Pro生成預覽圖像，即「世界草圖」。通過這一功能，用戶可以提前預覽自己即將創建的世界的大致模樣，並根據需求修改圖像，在正式進入世界之前對細節進行精細調整。

接下來進入「創建世界」環節，用戶每次操作限時60秒。所生成的世界具有高度逼真的效果，解析度達到720p，交互幀率保持在每秒20-24幀。當用戶在虛擬世界中移動時，Genie 3會根據用戶的動作實時生成前方的路徑。此外，用戶在與世界交互時可以調整相機視角，並且能夠下載自己漫遊世界的影片。

Genie 3還具備「Remix Worlds」（世界重組）功能，用戶可以基於現有世界的提示詞對其進行重新構建，創造出全新的詮釋。用戶可以在畫廊或隨機生成器圖標中探索精心挑選的世界，從中獲取靈感，也可以直接在這些現有世界的基礎上進行二次創作，進一步豐富自己的虛擬世界體驗。

除了60秒的操作時間限制外，谷歌也提醒用戶，生成的世界可能並非完全逼真，不一定能嚴格遵循提示詞或圖像，也可能不完全符合現實世界的物理規律。同時，角色的控制有時可能不夠精準，控制過程中可能會出現較高的延遲。

贊助商廣告

不過，谷歌正在努力改進Project Genie，計劃引入「可提示事件」，即根據用戶的探索行為改變世界狀態，以提升用戶體驗。

目前，該體驗權限已開始逐步向美國地區18歲及以上的Google AI Ultra訂閱用戶開放，後續將適時擴展到更多地區。