|
小模型力量大:Gemma 3 270M為專業領域而生
9 月03

小模型力量大:Gemma 3 270M為專業領域而生

過去對生成式 AI 的討論幾乎被「大模型」壟斷。人們談的是百億、千億參數的能力極限,卻往往忽略了「落地應用」的真正需求。Gemma 3 270M 的推出,正好提醒我們:AI 的未來不僅僅在於更大,而在於更適合。

Read More
互動式世界模型的新境界:Genie 3來了!
9 月01

互動式世界模型的新境界:Genie 3來了!

DeepMind 已經先後推出 Genie 1 與 Genie 2,嘗試讓模型依照指令生成新的環境。與此同時,他們在影片生成領域的 Veo 系列模型 也展現了 AI 對「直覺物理學」的掌握力。但直到 Genie 3,這一切才真正邁入了「互動式世界」的新階段。

Read More
Phi 4:「小而強」的專注型SLM模型
8 月21

Phi 4:「小而強」的專注型SLM模型

Phi 4 的出現,不僅是微軟的一次技術突破,更是一種理念的重申:AI 的未來並非一味追求「更大」,而是找到「更聰明、更安全、更普及」的路徑。

Read More
LLM如何「落地」?蒸餾、壓縮與微調技術比一比
8 月18

LLM如何「落地」?蒸餾、壓縮與微調技術比一比

蒸餾聚焦「智慧遷移」、壓縮專注「資源優化」、微調強調「專業提升」,合力推動語言模型在多樣應用環境的高效落地,本文將剖析它們在技術架構與應用場景中的定位與相互關聯。

Read More
開源推論模型邁入「直覺時代」:Cogito v2
8 月15

開源推論模型邁入「直覺時代」:Cogito v2

Cogito v2的推出,是一次對推論邏輯與模型直覺的一大進展:從推論鏈的內化,到自我強化學習的落地,Cogito v2 為開源社群帶來了一種嶄新的 AI 發展路線,指向通用超級智能的未來。

Read More
華為開源CANN,能否打破NVIDIA CUDA的護城河?
8 月14

華為開源CANN,能否打破NVIDIA CUDA的護城河?

華為旗下的昇騰(Ascend)AI處理器核心軟體平台CANN日前宣佈將全面開源,此舉被視為是針對NVIDIA的CUDA生態系統的宣戰,問題是,對AI產業的影響會有多大呢?

Read More