借鏡DeepSeek-R1訓練框架 耐能實現輕量級大語言模型
耐能(Kneron)宣佈取得了一項技術突破──借助DeepSeek-R1論文中提到的尖端訓練技巧,成功讓Kneron自研的LLM模型掌握了「思維鏈推理」和「自我反思」的能力,並已部署在伺服器上,為企業提供更智慧精準的AI解決方案。
看到DeepSeek就愣住了? 還有上百萬個AI模型等著你!
中國開發的大型語言模型DeepSeek因其卓越的性能和低成本(約600萬美元)引起了投資者的關注,甚至震撼了美國金融市場。對此一家總部位於美國的AI策略顧問機構Liftr Insights指出,中國對AI的野心遠不只有DeepSeek…
TrendForce:DeepSeek崛起凸顯AI產業將更注重高成本效益
根據TrendForce最新研究,DeepSeek近期連續發表DeepSeek-V3、R1等AI模型,使終端客戶未來更審慎評估投入AI基礎設施的合理性,採用更具效率的軟體運算模型,以降低對GPU等硬體的依賴。雲端服務供應商(CSP)則可能擴大採用自家ASIC基礎設施,以降低建置成本。
Alif第二代Ensemble MCU將為邊緣裝置實現低功耗生成式AI
Alif Semiconductor宣布推出第二代 Ensemble系列MCU產品。全新的E4、E6 與 E8 Ensemble MCU整合了Arm最新NPU Ethos-U85 和Alif的獨家高頻寬記憶體及智慧型電源管理架構,以支援Transformer網路所需之NPU運算子,並有效執行生成式AI工作負載。
第三屆晶心盃RISC-V創意大賽 設計巧思百花齊放
CPU設計業者晶心科技(Andes Technology)舉辦第三屆晶心盃RISC-V創意大賽,並於2024年底順利閉幕公布得獎名單。本次大賽以「人工智慧新紀元」為主題,吸引來自全台14所大專院校、超過百名學生參賽。
人形機器人2025發光? 資策會MIC分享CES觀展心得
資策會MIC分享研究團隊於CES 2025展場帶回的第一手產業情報,指出延續CES 2024聚焦AI從雲端落地終端,CES 2025聚焦終端消費性產品擴大AI的投入與深化,可歸納出四大趨勢重點。