|
加速英特爾GPU上的LLM:實用的動態量化指南
10 月09

加速英特爾GPU上的LLM:實用的動態量化指南

動態量化是一種強大的最佳化技術,能顯著提升Transformer模型在Intel GPU的性能,包括搭載於Lunar Lake、Arrow Lake處理器,配備XMX引擎的硬體,以及Alchemist、Battlemage等系列獨立顯卡。

Read More
【活動報導】輕鬆運用Intel Edge AI Suite開創智慧邊緣應用藍圖
9 月30

【活動報導】輕鬆運用Intel Edge AI Suite開創智慧邊緣應用藍圖

持續快速推進的人工智慧(AI)浪潮正從雲端湧向各種邊緣終端裝 [...]

Read More
OpenVINO 2025.3: 更多生成式AI,釋放無限可能
9 月26

OpenVINO 2025.3: 更多生成式AI,釋放無限可能

全新 OpenVINO 2025.3 版本帶來更快的上手體驗和更強大的性能。此次升級重點聚焦生成式AI,新增對多種尖端模型的支援,並推出全新GenAI流水線,全面擴展了OpenVINO Model Server的能力。

Read More
Intel Arc Pro B60顯卡與Xeon 6展現優異AI推論效能
9 月10

Intel Arc Pro B60顯卡與Xeon 6展現優異AI推論效能

MLCommons發佈最新MLPerf Inference v5.1基準測試結果,展現了搭載P-core的Intel Xeon處理器與Intel Arc Pro B60顯示卡的Intel GPU系統在六項關鍵基準測試的成果。

Read More
有了Intel AI Playground 不寫程式也能輕鬆玩生成式AI
9 月02

有了Intel AI Playground 不寫程式也能輕鬆玩生成式AI

Intel整合自家NPU/GPU硬體強大算力及OpenVINO開源推論工具套件,開發出一套「AI Playground」,讓聊天對話、文字生成影像及影像強化輕輕鬆鬆就能完成。

Read More
用OpenVINO GenAI解鎖LoRA微調模型推論
8 月29

用OpenVINO GenAI解鎖LoRA微調模型推論

借助OpenVINO GenAI,你可以無縫整合 LoRA配接器,實現對大語言模型的快速個性化客製。開發者還可以一次性載入多個LoRA配接器,並在執行時快速切換,無需重新編譯基礎模型。

Read More