生成式AI正從雲端模型走向裝置端代理式AI(Agentic AI),對於正著手實現所謂邊緣AI(Edge AI)應用落地的開發者來說,選擇恰當的AI模型與最符合算力需求的硬體,往往是工作流程中既耗費成本又花時間的艱難任務。為此美國高通公司(Qualcomm)推出Qualcomm® AI Hub,在雲端整合常見預訓練模型與多樣化裝置端硬體資源,讓AI模型部署最佳化與效能驗證的階段加速進行,讓開發者更快找出最適合的應用落地解決方案。
為了讓開發者親自體驗Qualcomm AI Hub如何支援Edge AI應用部署任務,以及搭載Snapdragon® X系列的AI PC效能表現,高通攜手生態系夥伴仨宇(Thuniverse)和媒體夥伴MakerPRO,於去年底舉辦了一場「邊緣智慧由你掌握:裝置上Gen AI應用開發與部署工作坊」,聚焦生成式AI應用在裝置端落地的實務,由專業技術講師帶領學員從模型選擇、最佳化、效能驗證到最終部署的完整開發流程,詳細解析Qualcomm AI Hub在Edge Gen AI 開發路徑中可帶來的優勢。同時,現場學員也使用搭載高通所打造的Snapdragon X系列處理器的AI PC,進行真機部署與效能量測,實際操作如何整合運用Qualcomm AI Hub與Thuniverse的Turu工具平台加速專案開發,掌握 Gen AI商業化的關鍵秘訣。

AI推論時代來臨:聚焦邊緣智慧
高通技術行銷資深總監Patrick於活動開場時首先指出,如今產業已正式邁入AI推論(inference)時代——AI 的價值核心正從「誰能訓練出最大模型」,轉變為「誰能讓推論即時、低功耗且普遍地運作於在每一個裝置上」。隨著模型快速小型化、新一代模型開始超越2024年的大型模型表現,以及生成式AI商用應用需求急遽升高,AI運算正加速由中央雲端移往裝置端與各層邊緣節點。他強調,唯有AI推論往下擴散至各種邊緣裝置,才能同時滿足即時性、效能與能源效率、隱私與安全、系統可靠度以及高度個人化等關鍵條件,使AI從雲端服務轉化為「隨身、即時、可信賴的智慧代理」,全面融入個人與企業的日常運作。

高通技術行銷資深總監Patrick
Patrick接著透過幾個推動AI未來發展的演進趨勢,描繪相關技術發展即將面臨的結構性變化。他指出,第一個重要趨勢是「AI將成為新的使用者介面」(AI is the new UI),成為未來人機互動核心,AI的應用正從以手機為中心(smartphone-centric)轉向以AI代理為中心(agent-centric),裝置不再只是工具,而是逐步成為能理解情境、主動行動的「個人AI分身」,重新定義人與科技的互動關係。
在運算架構上,Patrick進一步指出,AI正快速走向混合型(Hybrid)架構——即時推論、隱私資料處理與個人化決策將會在邊緣裝置端完成,而大型模型訓練、全球知識整合與長期優化則仍舊由雲端負責,形成「裝置即時反應、雲端持續進化」的閉環系統。未來模型也將不再是單一大型模型,而是導入Mixture of Experts(MoE)的多專家架構,能依任務需求動態調用一個或多個專家模型,同時透過階層式推論(Hierarchical Reasoning)機制,將「快速回應」留在裝置端、「深度推理」交由雲端處理,使推論效率、成本與體驗取得最佳平衡。
而真正驅動這個架構持續進化的燃料就是邊緣資料(Edge Data):每一台邊緣裝置所蒐集的感測資料與使用行為紀錄,將成為下一輪模型微調與智慧代理能力進化的核心動力,使 AI 代理能隨著時間累積變得越來越「懂」使用者。在網路層面,他則指出未來的通訊技術將不只是連線管道,而是為AI原生設計的感知型網路(Perceptive Networks);當行動通訊從5G邁進6G,網路將內建AI感知與決策能力,即時依據環境、負載與裝置需求進行最佳化調度,使AI服務在裝置、網路與雲端之間維持低延遲、低功耗與高可靠度運作,讓智慧代理真正做到「隨時連線、隨時可用」。

(圖片來源:Qualcomm)
Patrick總結指出,高通之所以能在AI時代持續保持領先,關鍵並不只在單一產品,而是在無線連網、低功耗高效能運算,以及裝置上AI加速三大核心能力上的長期整合布局。透過統一的AI SoC架構與 Qualcomm AI Hub 等開發資源,高通正逐步消弭不同裝置、作業系統與應用場域之間的開發斷層,讓開發者能以一次投資、跨平台部署的方式,將AI應用延伸至PC、手機、車用系統與IoT等裝置之中;他強調:「我們希望讓每一位開發者,都能更快把創意轉化為應用,轉化為價值。」

(圖片來源:Qualcomm)
WoS平台AI應用開發路徑詳解
緊接著高通AI軟體工程師Andrew將焦點集中在工作坊的主軸:開發者如何利用Qualcomm AI Hub等工具資源實際進行專案部署。課程內容分為兩大部分,首先是詳細介紹Qualcomm AI Hub、Windows on Snapdragon(WoS)開發工具鏈以及雲端裝置資源,如何能協助開發者加速應用部署流程、提升工作效率;接著進入實作體驗,帶領與會者在搭載Snapdragon X系列處理器的AI PC上完成模型部署、推論執行與效能觀察,實作裝置上Gen AI的落地部署。

高通AI軟體工程師Andrew
在模型評估與部署階段, Qualcomm AI Hub被定位為「模型工程化的加速器」,該平台不僅彙整超過280款已針對Snapdragon處理器最佳化的模型,涵蓋視覺、語音與生成式AI等多元應用,也支援 Bring Your Own Model(BYOM)模式,讓開發者上傳自有模型進行編譯、量化、效能分析與推論準確度驗證,並產出可量化的效能報告,協助開發者在不同Snapdragon處理器上進行選型與最佳化決策,縮短模型從研究階段走向產品化的時間。
在實際開發路徑的選擇上,ONNX Runtime與Qualcomm® AI Engine Direct(QNN)則構成了WoS AI應用的兩大主幹。ONNX Runtime憑藉跨平台特性與豐富社群資源,成為入門與快速產品概念驗證(PoC)的首選,透過高通提供的Execution Provider,即可呼叫NPU、GPU或CPU 加速。QNN則提供直通Snapdragon處理器內建NPU的原生效能通道,適合對延遲、功耗與穩定度高度敏感的Gen AI與即時多模態應用。從應用架構來看,完整的WoS AI推論流程涵蓋前處理、模型載入與推論執行,透過高通工具鏈將異質運算細節抽象化,讓開發者專注於應用邏輯,同時確保模型能在地端裝置上以低延遲、高隱私與高效率的方式穩定運作。

(圖片來源:Qualcomm)
在模型評估與部署階段,Andrew Yang將 Qualcomm AI Hub 定位為「模型工程化的加速器」,該平台不僅彙整超過280款已針對Snapdragon平台最佳化的模型,涵蓋視覺、語音與生成式AI等多元應用,也支援 Bring Your Own Model(BYOM)模式,讓開發者上傳自有模型進行編譯、量化、效能分析與推論準確度驗證,並產出可量化的效能報告,協助開發者在不同Snapdragon平台上進行選型與最佳化決策,縮短模型從研究階段走向產品化的週期。
在實際開發路徑的選擇上,ONNX Runtime與 QNN(Qualcomm AI Engine Direct)則構成了WoS AI應用的兩大主幹。ONNX Runtime憑藉跨平台特性與豐富社群資源,成為入門與快速產品概念驗證(PoC)的首選,透過高通提供的Execution Provider,即可呼叫NPU、GPU或CPU 加速。QNN則提供直通Snapdragon NPU 的原生效能通道,適合對延遲、功耗與穩定度高度敏感的GenAI與即時多模態應用。從應用架構來看,完整的WoS AI推論流程涵蓋前處理、模型載入與推論執行,透過高通工具鏈將異質運算細節抽象化,讓開發者專注於應用邏輯,同時確保模型能在地端裝置上以低延遲、高隱私與高效率的方式穩定運作。

(圖片來源:Qualcomm)
從裝置上推論到Agentic AI系統實作
在詳細介紹Qualcomm AI Hub等工具資源之後,Andrew也帶領現場學員在搭載Snapdragon X系列處理器的AI PC上進行實機部署、推論執行與效能觀察的實作。同時高通也邀請到合作夥伴Thuniverse的軟體工程師林敬寶,示範如何在此基礎上把單一模型升級為可實際投入應用場景Agentic AI系統。他指出,Thuniverse打造的Turu平台的定位並非單一應用程式,而是一套Agentic Orchestration OS,提供No-code/Low-code的視覺化流程編排環境,讓開發者能在搭載Snapdragon X系列處理器的AI PC上快速組裝生成式AI代理,將搜尋、文件與資料庫檢索與問答、語音轉文字、影像生成等模組化功能串接成可運作的任務流程,讓AI不只是被動回應指令,而是能主動協助完成一連串工作。

在實際操作中,Turu已預先整合Qualcomm AI Hub上的多款主流模型,包括Llama 3.1、Phi 3.5、TAIDE 8B、Stable Diffusion與Whisper等,並能直接呼叫Snapdragon X系列處理器內建的NPU進行加速推論,使與會者現場即可完成會議摘要、內部知識問答、影像生成與語音轉文字等裝置上Gen AI應用實作,且不需將敏感資料上傳雲端。進一步透過多代理協作、任務分段與流程型編排機制,Turu展現了Agentic AI在企業內部導入的實際樣貌,讓生成式AI從單點功能升級為可嵌入營運流程的系統級智慧,具體描繪出Edge Gen AI商業化落地的可行路徑。

(圖片來源:Thuniverse)
結語:Edge GenAI 重塑產業創新模式
從理解AI進入推論時代的發展動力、Qualcomm AI Hub與工具資源詳解,再到AI PC實機部署,這場工作坊不只是單方面的技術解決方案簡報,更讓開發者清晰看見並親自體驗了一條完整的Edge AI落地路徑,與會學員也因此更充分認知「Gen AI在裝置端運行」不再只是概念,而是已可快速導入企業內部流程的可行方案。

隨著Snapdragon生態系持續擴大與成熟,高通正逐步建立一條從模型選擇、最佳化、驗證到應用部署的完整開發通道,為推動Edge Gen AI的商業化大量部署提供豐富資源與助力。這場工作坊也為台灣開發者社群提供一個可實踐、可複製的裝置端AI範本,預告未來搭載Snapdragon處理器的裝置,將成為生成式AI走向個人化、低延遲與高隱私應用的重要核心載具之一;高通如何為各產業領域導入AI的創新模式帶來改變,值得繼續密切關注!

》收看課程影片
- 邊緣智慧輕鬆駕馭:高通帶領開發者掌握裝置上Gen AI應用部署關鍵 - 2026/02/06
- 改寫IoT領域競爭格局 TI宣佈以75億美元收購Silicon Labs - 2026/02/05
- 搭配48V供電網路 創新技術1分鐘搞定車窗除霜 - 2026/02/05
訂閱MakerPRO知識充電報
與40000位開發者一同掌握科技創新的技術資訊!



