|
本地端高效、高畫質影片生成引擎來了:LTX-2
10 月28

本地端高效、高畫質影片生成引擎來了:LTX-2

LTX-2 不只是另一款技術模型,它標誌著「生成式影片」從邊緣試驗進入「廣泛創作/實務應用」的時代。對 Edge AI 開發者而言,LTX-2 則代表生成式 AI 已逐步邁向「可在本地運行、低延遲、可整合於實際應用管線」的新階段。

Read More
AI文件理解技術比一比:GPT-5與DeepSeek-OCR
10 月27

AI文件理解技術比一比:GPT-5與DeepSeek-OCR

本文將針對兩個代表性OCR AI模型做個比較:OpenAI 的 GPT-5,及 DeepSeek-OCR。前者以跨模態理解的深度與語意推理著稱,後者則以極致的文件精讀能力與高效率 OCR 表現贏得開發者青睞,兩者正代表了 AI 文件理解的兩條主流技術路線。

Read More
讓AI掌握行動力的關鍵:VLA模型
9 月16

讓AI掌握行動力的關鍵:VLA模型

正如一位研究者在接受訪問時所言:「過去十年,我們讓 AI 學會思考;未來十年,我們要讓 AI 學會行動。」而 VLA,正是這場變革的開端。

Read More
來自阿拉伯世界的先進LLM:Falcon系列
9 月01

來自阿拉伯世界的先進LLM:Falcon系列

Falcon LLM家族不僅展現了尖端技術的突破,更代表了一種面向未來、包容性強且專注倫理的AI開發理念。從Falcon-H1的混合架構到Falcon-E的邊緣計算適配,從全模態的Falcon 3到革命性Mamba 7B,每一個創新都在為生成式AI的普及和深化應用鋪路。

Read More
從工具到落地 OpenVINO引領多模態AI新時代
8 月28

從工具到落地 OpenVINO引領多模態AI新時代

2025年第二場OpenVINO DevCon線上講座,聚焦OpenVINO 2025.2最新版本的技術升級,並延伸至認知型AI與多模態RAG的應用場景,最後還邀請來自學界的專家分享了MLLM實際落地的案例。

Read More
Phi 4:「小而強」的專注型SLM模型
8 月21

Phi 4:「小而強」的專注型SLM模型

Phi 4 的出現,不僅是微軟的一次技術突破,更是一種理念的重申:AI 的未來並非一味追求「更大」,而是找到「更聰明、更安全、更普及」的路徑。

Read More