【Arm的AI世界】運用小語言模型在邊緣端實現生成式AI
儘管大語言模型(LLM)更廣為人知,但由於小語言模型(SLM)能夠以更少資源、較低成本提供出色的效能,而且訓練起來也更為簡易且成本更低,因此受到越來越多的關注;Arm展示了搭載Ethos-U85 NPU的系統晶片解決方案如何在嵌入式硬體上運作小語言模型。
AI代理到底行不行?IBM Research推出開源基準測試
近年來,生成式AI技術的發展令人矚目,各類AI系統已能夠撰寫詩歌、解決程式設計問題,甚至能夠與使用者進行對話。然而,在企業環境中,這類AI系統的應用仍相對有限,主要原因之一是缺乏客觀標準來衡量其在解決企業IT問題方面的實際成效。
借鏡DeepSeek-R1訓練框架 耐能實現輕量級大語言模型
耐能(Kneron)宣佈取得了一項技術突破──借助DeepSeek-R1論文中提到的尖端訓練技巧,成功讓Kneron自研的LLM模型掌握了「思維鏈推理」和「自我反思」的能力,並已部署在伺服器上,為企業提供更智慧精準的AI解決方案。
看到DeepSeek就愣住了? 還有上百萬個AI模型等著你!
中國開發的大型語言模型DeepSeek因其卓越的性能和低成本(約600萬美元)引起了投資者的關注,甚至震撼了美國金融市場。對此一家總部位於美國的AI策略顧問機構Liftr Insights指出,中國對AI的野心遠不只有DeepSeek…
AI助教來了!人工智慧將改變傳統教育模式
隨著科技的快速進步,人工智慧(AI)在各個領域的應用與結合越來越廣泛,包括教育和學術領域。AI在教育領域的應用不僅是一場技術革命,更是一場深刻的教育模式變革。然而,AI的導入也同時伴隨著挑戰,對相關工具在教育現場扮演的角色需要審慎考量。
TrendForce:DeepSeek崛起凸顯AI產業將更注重高成本效益
根據TrendForce最新研究,DeepSeek近期連續發表DeepSeek-V3、R1等AI模型,使終端客戶未來更審慎評估投入AI基礎設施的合理性,採用更具效率的軟體運算模型,以降低對GPU等硬體的依賴。雲端服務供應商(CSP)則可能擴大採用自家ASIC基礎設施,以降低建置成本。