藉DeepSeek雜談AI技術觀念
DeepSeek讓大語言模型再掀熱潮,以低費用、少量運算力、短暫時間就訓練出與今日主流大語言模型相仿的表現,讓各界吃驚。不過有關DeepSeek的各種說法,有時候有些混淆,筆者藉此文想聊一下,或許可以幫一些人釐清,或讓平時對AI有興趣的人有更深刻的瞭解。
替本機端大語言模型Ollama裝上親和介面
毫無疑問的,Ollama是近期非常熱門的本機端大語言模型(LLM)管理工具,透過Ollama可以下載、執行許多知名的大語言模型,如Meta的Llama、Microsoft的Phi、Google的Gemma等。
產業級Arduino也擁抱LLM AI
Arduino於CES期間宣佈與荷蘭新創晶片商Axelera合作,該公司的晶片與軟體將與Arduino Pro系列中的Portenta X8板搭配使用。本篇文章將會對此進行說明!
【從科幻到現實】勾勒AI未來情境 (下) – 以假亂真的AI世界
本文要談的是AI如何讓「虛擬」與「現實」的界限更模糊了,其中生成式AI正是重要的推手,不僅造就了Digital Human,也讓元宇宙有機會成真。
加速實體AI開發 NVIDIA推出Cosmos世界基礎模型並開放使用
NVIDIA在CES 2025宣布推出NVIDIA Cosmos平台,包含生成式AI世界基礎模型(WFM)、先進標記器、防護機制、加速視訊處理的流水線;同時該公司也宣布將在允許商業用途的寬容式開放模型授權下,讓研究與開發人員自由使用Cosmos WFM。
NVIDIA讓TensorRT-LLM推論效率增速三倍
最近(2024年12月)NVIDIA新發佈,在TensorRT-LLM中加入了推測性解碼技術,從而讓TensorRT-LLM的推論效率提升三倍。