|
  • 單元
  • 技術導讀
  • 教學文

加速英特爾GPU上的LLM:實用的動態量化指南

動態量化是一種強大的最佳化技術,能顯著提升Transformer模型在Intel GPU的性能,包括搭載於Lunar Lake、Arrow Lake處理器,配備XMX引擎的硬體,以及Alchemist、Battlemage等系列獨立顯卡。

AI自主再進化:從VLM的理解到VLA的行動

本文整理本刊VLM及VLA的技術導讀文章,剖析這兩個AI模型技術的迭代串連及對未來的影響力。

宣佈收購Arduino 高通積極拉攏Edge AI開發者社群

高通(Qualcomm Technologies, Inc.)宣布收購開源硬體與軟體領導品牌Arduino,藉此強化其邊緣運算與人工智慧(AI)生態系布局。

【Arm的AI世界】GitHub與Arm為開發者徹底改變在Windows上的開發作業

GitHub與Arm緊密合作,致力於最佳化在Arm平台上開發的體驗,透過強化的工作流程,整合原生Arm runner、內建必要工具與函式庫的映像檔,以及GitHub Copilot Extensions,協助開發者運用AI加速開發。

WorldVLA:視覺、語言與動作的融合之路

WorldVLA 是一個自回歸動作世界模型,它將動作和圖像的理解與生成統一起來。 WorldVLA 將視覺-語言-動作 (VLA) 模型(動作模型)和世界模型整合在一個框架中。

以工程角度檢視NVIDIA Jetson Thor

有關NVIDIA Jetson Thor的規格已有相關報導,在此不贅述,筆者在此要討論的是Jetson Thor背後的實現工程,如同此前筆者曾討論過DGX Spark的GB10與DGX Station的GB300一樣。

Qualcomm RB系列開發板觀察

筆者研究了一下Qualcomm的機器人相關開發板(稱為RB系列)後,覺得裡頭有一些細節可以分享,以利諸位創客大大更快評估與掌握。

AI模型誰最「聰明」?IQ 排行榜比一比

截至 2025 年 9 月底,TrackingAI 公開的 Mensa Norway 測驗排行榜顯示,Grok-4 模型高居榜首,8-9月智商分數平均為 123 分,已靠近「天才級」範圍(>130)。換算成人類的語境,這意味著它的推理表現超過了大部分的人類。

Claude生、Claude生:Claude生成各種Python視窗專案

各種GenAI中,Claude最能準確的生成出Arduino、Python程式碼,本文將以三個專案為例,示範如何使用GenAI生成出想要的結果。

【活動報導】輕鬆運用Intel Edge AI Suite開創智慧邊緣應用藍圖

持續快速推進的人工智慧(AI)浪潮正從雲端湧向各種邊緣終端裝 [...]

AI自主再進化:從VLM的理解到VLA的行動

本文整理本刊VLM及VLA的技術導讀文章,剖析這兩個AI模型技術的迭代串連及對未來的影響力。

WorldVLA:視覺、語言與動作的融合之路

WorldVLA 是一個自回歸動作世界模型,它將動作和圖像的理解與生成統一起來。 WorldVLA 將視覺-語言-動作 (VLA) 模型(動作模型)和世界模型整合在一個框架中。

ML.ENERGY能效排行榜:讓你看見LLM回應背後的電表數字!

密西根大學研究團隊推出的 ML.ENERGY Leaderboard 能效觀測排行榜,透過名為 Zeus 的開源測量工具,能精準追蹤 CPU、GPU 在 LLM 推論過程中的能耗,並以公開數據的形式排名,讓外界第一次能清楚看見「AI 回應背後的電表數字」。

Helix Model:讓人形機器人真的懂你!

Helix 的誕生,標誌著人形機器人真正邁向家庭應用的關鍵一步。它不僅能快速而精確地控制整個上半身,還能理解語言、泛化到從未見過的物品,甚至在多機器人場景中協作。

讓AI掌握行動力的關鍵:VLA模型

正如一位研究者在接受訪問時所言:「過去十年,我們讓 AI 學會思考;未來十年,我們要讓 AI 學會行動。」而 VLA,正是這場變革的開端。

當AI遇上自動化:MCP與Workflow工具的新交會點

Node-RED 與 n8n 代表了靜態、自動化的世界;MCP + AI 代表了動態、智能化的未來。兩者的結合,則是一個能夠聽懂需求、即時組裝工具的「智慧協作體系」。

【Arm的AI世界】在裸機環境運作KleidiAI MatMul核心

本文將介紹如何在裸機環境中運作KleidiAI微核心,並針對不同編譯器在不同最佳化等級下的表現進行基礎的基準測試。

小模型力量大:Gemma 3 270M為專業領域而生

過去對生成式 AI 的討論幾乎被「大模型」壟斷。人們談的是百億、千億參數的能力極限,卻往往忽略了「落地應用」的真正需求。Gemma 3 270M 的推出,正好提醒我們:AI 的未來不僅僅在於更大,而在於更適合。

有了Intel AI Playground 不寫程式也能輕鬆玩生成式AI

Intel整合自家NPU/GPU硬體強大算力及OpenVINO開源推論工具套件,開發出一套「AI Playground」,讓聊天對話、文字生成影像及影像強化輕輕鬆鬆就能完成。

互動式世界模型的新境界:Genie 3來了!

DeepMind 已經先後推出 Genie 1 與 Genie 2,嘗試讓模型依照指令生成新的環境。與此同時,他們在影片生成領域的 Veo 系列模型 也展現了 AI 對「直覺物理學」的掌握力。但直到 Genie 3,這一切才真正邁入了「互動式世界」的新階段。

加速英特爾GPU上的LLM:實用的動態量化指南

動態量化是一種強大的最佳化技術,能顯著提升Transformer模型在Intel GPU的性能,包括搭載於Lunar Lake、Arrow Lake處理器,配備XMX引擎的硬體,以及Alchemist、Battlemage等系列獨立顯卡。

【Arm的AI世界】GitHub與Arm為開發者徹底改變在Windows上的開發作業

GitHub與Arm緊密合作,致力於最佳化在Arm平台上開發的體驗,透過強化的工作流程,整合原生Arm runner、內建必要工具與函式庫的映像檔,以及GitHub Copilot Extensions,協助開發者運用AI加速開發。

Claude生、Claude生:Claude生成各種Python視窗專案

各種GenAI中,Claude最能準確的生成出Arduino、Python程式碼,本文將以三個專案為例,示範如何使用GenAI生成出想要的結果。

OpenVINO 2025.3: 更多生成式AI,釋放無限可能

全新 OpenVINO 2025.3 版本帶來更快的上手體驗和更強大的性能。此次升級重點聚焦生成式AI,新增對多種尖端模型的支援,並推出全新GenAI流水線,全面擴展了OpenVINO Model Server的能力。

Windows on Snapdragon部署GenAI策略指南

筆者在前一篇文章介紹了如何使用Qualcomm AI Hub來快速地在Windows on Snapdragon (WoS)完成AI應用的部署,然而身為被認證為Copilot+ PC的成員,要能順暢運作本地端生成式AI模型及開發衍生應用才是其最重要的主戰場!本篇文章將會介紹幾種不同的方法在WoS實現本地端生成式AI模型的運作。

【Arm的AI世界】在裸機環境運作KleidiAI MatMul核心

本文將介紹如何在裸機環境中運作KleidiAI微核心,並針對不同編譯器在不同最佳化等級下的表現進行基礎的基準測試。

有了Intel AI Playground 不寫程式也能輕鬆玩生成式AI

Intel整合自家NPU/GPU硬體強大算力及OpenVINO開源推論工具套件,開發出一套「AI Playground」,讓聊天對話、文字生成影像及影像強化輕輕鬆鬆就能完成。

用OpenVINO GenAI解鎖LoRA微調模型推論

借助OpenVINO GenAI,你可以無縫整合 LoRA配接器,實現對大語言模型的快速個性化客製。開發者還可以一次性載入多個LoRA配接器,並在執行時快速切換,無需重新編譯基礎模型。

GenAI生成多媒體播放器

本文將介紹如何使用 ChatGPT 生成Python 程式碼,設計出圖檔、影片檔與音檔三大類常見的多媒體播放器。

在家造AI神器!OpenVINO讓桌面推論觸手可及

AI PC是一台配備專門用於加速AI工作負載硬體的電腦,意味著我們可以高效率地運作包含AI模型的應用程式;透過精選的軟硬體,筆者將證明幾乎任何類型的AI應用都可以在本地運作。