致敬?回敬?繼NVIDIA Chat with RTX後AMD亦推行LLM Studio
LLM/GenAI倚賴雲端資料中心機房裡龐大的運算力,才能即時完成推論結果並回應,一旦網路斷線就無法使用,同時,雲端執行也有洩漏公司機密或個人隱私等風險,鑑於此,不少人開始期待透過本地端或本機端執行LLM。本篇文章,就會介紹AMD推行的LLM Studio,其可下載於本地端進行簡單的聊天問答。
新唐發表以MCU/MPU為基礎的終端AI平台
以擴展AI生態系至微控制器(MCU)領域為目標,新唐科技(Nuvoton)宣布推出基於微控制器的終端AI平台;此解決方案以新唐全新架構設計的微控制器和微處理器為基礎,包括NuMicro MA35D1、NuMicro M467以及配備Arm Ethos-U55 NPU的NuMicro M55M1系列。
OpenVINO 2024.0:為開發者提供更高性能、更強大支援
OpenVINO 2024.0來了!我們很高興在這個版本推出一系列強化功能,目標是在快速發展的AI領域賦予開發者更強大的能力;新版本透過動態量化、改善的GPU最佳化以及對混合專家(MoE)模型架構的支援,增強了大語言模型(LLM)的性能。OpenVINO 2024.0讓開發者能有效利用AI加速,這也要感謝來自社群的持續貢獻。
英特爾攜手合作夥伴助力AI PC創作新世代
英特爾攜手宏碁、Adobe、華碩、訊連科技、微星科技等合作夥伴,於台北三創生活園區舉辦為期四天的「AI PC創作新世代」活動,現場展示多款最新基於Intel Core Ultra的AI PC系統與影像創作應用,並邀請橫跨不同領域的專業創作團隊分享如何透過AI PC解決創作過程中遇到的瓶頸,以及如何能有效發揮創作軟體各式各樣的功能,提升整體流程效率,進而激發更多創意。
【Arm的AI世界】能將神經網路提升至更高境界的ML推論諮詢工具
Arm正在運用以支援AI快速發展為設計目標的解決方案,來打造邁向未來的路徑。其中的一項挑戰,是讓相關社群能夠取用新興的技術。在這篇部落格文章中我們將介紹Arm機器學習推論諮詢工具(Arm ML Inference Advisor,Arm MLIA),並讓大家看到如何運用它來提升Arm IP的模型效能。我們同時也會解釋一些相關的前置作業,以及為何這些作業如此重要。
以可重構NPU實現邊緣應用 耐能致力推動AI民主化
成立於2015年、擁有台灣血統的AI晶片設計業者耐能智慧(Kneron),於2023年底針對企業應用發表以該公司神經網路處理器(NPU)技術為基礎的KNEO 300系列EDGE GPT邊緣裝置,主打可藉由在裝置本地端(不須連結網際網路)運作GPT大語言模型,為使用者實現低延遲、高效率且具備隱私保護與資料安全性的各種Edge AI推論應用,在市場上掀起一波討論熱潮…