互動式世界模型的新境界:Genie 3來了!
DeepMind 已經先後推出 Genie 1 與 Genie 2,嘗試讓模型依照指令生成新的環境。與此同時,他們在影片生成領域的 Veo 系列模型 也展現了 AI 對「直覺物理學」的掌握力。但直到 Genie 3,這一切才真正邁入了「互動式世界」的新階段。
Phi 4:「小而強」的專注型SLM模型
Phi 4 的出現,不僅是微軟的一次技術突破,更是一種理念的重申:AI 的未來並非一味追求「更大」,而是找到「更聰明、更安全、更普及」的路徑。
LLM如何「落地」?蒸餾、壓縮與微調技術比一比
蒸餾聚焦「智慧遷移」、壓縮專注「資源優化」、微調強調「專業提升」,合力推動語言模型在多樣應用環境的高效落地,本文將剖析它們在技術架構與應用場景中的定位與相互關聯。
開源推論模型邁入「直覺時代」:Cogito v2
Cogito v2的推出,是一次對推論邏輯與模型直覺的一大進展:從推論鏈的內化,到自我強化學習的落地,Cogito v2 為開源社群帶來了一種嶄新的 AI 發展路線,指向通用超級智能的未來。
華為開源CANN,能否打破NVIDIA CUDA的護城河?
華為旗下的昇騰(Ascend)AI處理器核心軟體平台CANN日前宣佈將全面開源,此舉被視為是針對NVIDIA的CUDA生態系統的宣戰,問題是,對AI產業的影響會有多大呢?
Meta的世界模型:V-JEPA 2如何讓機器學會「先想像再行動」
AI能看到眼前的世界,並推測下一秒將會發生什麼?Meta最新發表的 V-JEPA 2 世界模型,正是向這個方向跨出關鍵一步——它不只是辨識影像,而是理解因果、預測未來,甚至在陌生環境中替機器人規劃行動。