加速英特爾GPU上的LLM:實用的動態量化指南
動態量化是一種強大的最佳化技術,能顯著提升Transformer模型在Intel GPU的性能,包括搭載於Lunar Lake、Arrow Lake處理器,配備XMX引擎的硬體,以及Alchemist、Battlemage等系列獨立顯卡。
【Arm的AI世界】GitHub與Arm為開發者徹底改變在Windows上的開發作業
GitHub與Arm緊密合作,致力於最佳化在Arm平台上開發的體驗,透過強化的工作流程,整合原生Arm runner、內建必要工具與函式庫的映像檔,以及GitHub Copilot Extensions,協助開發者運用AI加速開發。
OpenVINO 2025.3: 更多生成式AI,釋放無限可能
全新 OpenVINO 2025.3 版本帶來更快的上手體驗和更強大的性能。此次升級重點聚焦生成式AI,新增對多種尖端模型的支援,並推出全新GenAI流水線,全面擴展了OpenVINO Model Server的能力。
Windows on Snapdragon部署GenAI策略指南
筆者在前一篇文章介紹了如何使用Qualcomm AI Hub來快速地在Windows on Snapdragon (WoS)完成AI應用的部署,然而身為被認證為Copilot+ PC的成員,要能順暢運作本地端生成式AI模型及開發衍生應用才是其最重要的主戰場!本篇文章將會介紹幾種不同的方法在WoS實現本地端生成式AI模型的運作。
NVIDIA與Intel宣佈攜手開發AI基礎設施與個人運算產品
NVIDIA與Intel宣布將共同開發多世代的客製化資料中心與PC產品,雙方合作內容將聚焦於透過NVIDIA NVLink技術無縫連結NVIDIA和英特爾架構,結合NVIDIA的AI加速運算優勢與英特爾處理器技術和x86生態系,為客戶提供最先進的解決方案。
有了Intel AI Playground 不寫程式也能輕鬆玩生成式AI
Intel整合自家NPU/GPU硬體強大算力及OpenVINO開源推論工具套件,開發出一套「AI Playground」,讓聊天對話、文字生成影像及影像強化輕輕鬆鬆就能完成。