互動式世界模型的新境界:Genie 3來了!
DeepMind 已經先後推出 Genie 1 與 Genie 2,嘗試讓模型依照指令生成新的環境。與此同時,他們在影片生成領域的 Veo 系列模型 也展現了 AI 對「直覺物理學」的掌握力。但直到 Genie 3,這一切才真正邁入了「互動式世界」的新階段。
Meta的世界模型:V-JEPA 2如何讓機器學會「先想像再行動」
AI能看到眼前的世界,並推測下一秒將會發生什麼?Meta最新發表的 V-JEPA 2 世界模型,正是向這個方向跨出關鍵一步——它不只是辨識影像,而是理解因果、預測未來,甚至在陌生環境中替機器人規劃行動。