加速英特爾GPU上的LLM:實用的動態量化指南
動態量化是一種強大的最佳化技術,能顯著提升Transformer模型在Intel GPU的性能,包括搭載於Lunar Lake、Arrow Lake處理器,配備XMX引擎的硬體,以及Alchemist、Battlemage等系列獨立顯卡。
OpenVINO 2025.3: 更多生成式AI,釋放無限可能
全新 OpenVINO 2025.3 版本帶來更快的上手體驗和更強大的性能。此次升級重點聚焦生成式AI,新增對多種尖端模型的支援,並推出全新GenAI流水線,全面擴展了OpenVINO Model Server的能力。
Intel Arc Pro B60顯卡與Xeon 6展現優異AI推論效能
MLCommons發佈最新MLPerf Inference v5.1基準測試結果,展現了搭載P-core的Intel Xeon處理器與Intel Arc Pro B60顯示卡的Intel GPU系統在六項關鍵基準測試的成果。
有了Intel AI Playground 不寫程式也能輕鬆玩生成式AI
Intel整合自家NPU/GPU硬體強大算力及OpenVINO開源推論工具套件,開發出一套「AI Playground」,讓聊天對話、文字生成影像及影像強化輕輕鬆鬆就能完成。
用OpenVINO GenAI解鎖LoRA微調模型推論
借助OpenVINO GenAI,你可以無縫整合 LoRA配接器,實現對大語言模型的快速個性化客製。開發者還可以一次性載入多個LoRA配接器,並在執行時快速切換,無需重新編譯基礎模型。