Arm Developer Experience 開發者技術演講會後報導 | COMPUTEX 2025
此次 Computex 2025 Arm 特別為開發者舉辦了線下技術分享及交流活動。第一天主要以雲端人工智慧(Cloud AI)為主軸,而第二天則將重點放在行動遊戲與行動人工智慧(Mobile Gaming and Mobile AI)。
第二天活動一開場由 Arm 解決方案首席架構師 Odin Shen幫大家介紹 「Arm Developer Program (Arm 開發人員計畫)」,讓開發者更了解各項技術的學習路徑及加入開發人員計畫的好處。接著由 Arm Staff Engineer Patrick Wang 用精彩的動畫說明「Immortalis GPU」如何讓手機上 3D 繪圖能有更完美、快速的全域光照處理及高解析度畫質。
緊接著 Arm 首席開發者關係工程師 Owen Wu 帶來「Arm Performance Studio」及「Arm Frame Advisor」的深入技術剖析,讓開發者能更清楚透過視覺化工具了解 GPU 在執行時的瓶頸及如何改善冗餘工作提升效能。休息片刻後,由伙伴廠商給出實際應用案例,包括成境科技(Red Pill Lab)的手部姿態估測(Hand Pose Estimation)及訊連科技(CyberLink)的智慧影音編輯軟體。最後由 Odin 分享 Arm 最新 AI Micro Kernel 「KleidiAI & MNN」如何在安卓手機上加速視覺大語言模型(Vision LLM)推論工作。接下來就為大家將重點整理如下。
Arm Developer Program (Arm 開發人員計畫)

Arm解決方案首席架構師Odin Shen
為了讓 Arm 的開發者有更好的線上學習環境及良好的互動機制,近年來開始推動「Arm Developer Program」[1]。只要你是 Arm 相關產品開發者,不管是公司內部或獨立研發人員,都可免費加入成為基本會員(Members),享受各種技術文件及線上交流權利。若已經常性在某個特定領域持續分享個人使用 Arm 的心得,不論是文字、影音或線上/線下活動,那麼就可考慮申請「開發者大使(Ambassadors)」擴散相關技術。當有特殊貢獻者,會由 Arm 內部推薦成為「傑出開發者大使(Distinguished Ambassadors)」。擔任大使有很多好處,包括增加社群曝光度,可優先取得較新技術訊息,並有機會獲得辦理活動相關補助等。當然擔任大使也不用擔心有太大壓力,因為當遇到任何技術問題時,有 Arm 的內部專家(Experts)會全力協助,讓社群能更加順暢運作。目前全世界已有近二百位大使,台灣地區也有一位。

Arm 開發人員計畫組成方式
如果你想增加你對 Arm 產品的專業技能,擴增你的專業社群人脈,想要和 Arm 一起創造不一樣的未來,那麼就快點加入「Arm Developer Program」[1]。更多相關學習路徑可參考「Arm Developer Hub – Learning Path」[2]。

加入Arm開發人員計畫的優點
Immortalis GPU & 使用虛幻引擎的全域照明技術製作的3D遊戲Mori

全域照明技術與Arm Staff Engineer Patrick Wang
為了手機端也能滿足低功耗、高效能、高解析度 3D 渲染能力,目前在旗艦版 SoC 中通常配置有 Arm Immortalis-G925 GPU(14核)。相較於前一代 G720 (12核) 整體繪圖效能高 37%,AI/ML推論效能高36%,功耗低30%,光追跡性能最高多出52%。

Arm Immortalis-G925 架構及性能表現
為了測試 G925 的性能表現,使用了虛幻引擎的全域照明技術(Unreal Engine – Lumen)製作名為林間鼯鼠(Mori) 的3D遊戲,主要展示光線追蹤(Ray Tracing)、全域照明(Global Illuminate)及超解析度(Accuracy Super Resolution, ASR)圖像提升技術。

使用Unreal Engine – Lumen產生的全域照明效果。
一般為了加快場景中 3D 影像渲染計算,會使用低解析度渲染輸出,再以 2D 放大來提高顯示解析度。這樣作不只可加快處理速度更可節省大量運算過程中所需記憶體,但缺點是影像會變得較模糊。為了解決這個問題, 精確超解析度(Arm Accuracy Super Resolution, Arm ASR)圖像提升技術 [3]。它整合了空間及時間超解析度,即保留了空間超解析度的快速計算及低記憶體需求,同時利用時間超解析度解決影像模糊問題。如下面結果圖示可看出 ASR 開啟時其細節保留的較好,即產生接近相同的視覺觀賞效果,只需較少的計算。

虛線框為 Arm ASR 開啟效果

紅色部份為 Arm ASR 開啟及關閉差異處,可看出其細節保留較完整。
當開啟 ASR 時,若影像放大 1.5 到 2.0 倍時,其每秒影格數(Frame per Second, FPS),可提高 1.54 到 2.0 倍,而每瓦能處理的 FPS 亦可提高 1.44 到 1.83 倍,如下圖所示。
Arm Performance Studio & Frame Advisor

Arm首席開發者關係工程師Owen Wu
以往開發安卓手機遊戲的工程師很難了解運行時不同硬體規格下 CPU(Arm Cortex-A, Cortex-X) / GPU(Mali, Immortalis) 的運行效能?哪些步驟是關鍵及瓶頸?因此 Arm 推出免費開源可視化工具 Arm Performance Studio [4] [5],提供開發者使用圖表方式輕鬆監看系統運行效能,其中包括下列項目。
- 串流資訊(Streamline) – 對繪圖處理器與 32 及 64 位元 CPU 計數器進行更深度的分析,剖析您的遊戲,找出瓶頸並最佳化程式碼。
- 效能建議工具(Performance Advisor) – 直覺式總結報告可定位問題區域並縮短系統層級分析時間。
- Mali 離線編譯器(Mali Offline Compiler) – 研究著色器核心,瞭解 Mali 繪圖處理器的效能。
- 影格建議工具(Frame Advisor) – 支援多種圖像框架(OpenGL ES, Vulkan),直覺式影格負載分析。
- 渲染文件(RenderDoc)功能擴充 – 早期支援多種圖像框架(OpenGL ES, Vulkan)的擴充功能,提供渲染相關資訊可視化。

免費開源可視化效能分析工具 Arm Performance Studio
為了讓大家更深入了解 Arm Frame Advisor [6] 如何協助分析及改善渲染圖/渲染路徑(Render Graph / Render Path),Owen Wu 給出更進一步說明。首先補充其更完整細節,包括基於影格剖析及特徵分析,接著使用一個案例說明如何逐步將冗餘部份去除,最後能得到 6 到 8 倍的速度提升,如下圖所示。

使用 Arm Frame Advisor 優化渲染路徑範例
另外這項工具亦提供影格緩衝區(Framebuffers)逐格檢查功能,可針對遠離攝影機過多三角面、無效操作繪圖及重複繪製等項目進行分析。幾何度量(Geometry Metrics)功能可協助檢查頂點著色器效率(Vertex Shading Efficiency),包括未使用頂點、重複頂點、頂點重新著色等問題。另外亦可協助檢查頂點記憶體效率(Vertex Memory Efficiency),包括太多資料、未使用之頂點載入及未使用之資料載入等問題。

Arm Frame Advisor 之影格緩衝區及幾何度量操作畫面
Red Pill Lab 手部姿態估測及追蹤

Red Pill Lab執行長RH Shih
Red Pill Lab (成境科技) [7] 總部設於台北,專注於次世代人體動作辨識技術的研發,致力打造輕量化、高效能的 AI 動作模型。團隊所開發的 VideoPose 模型,僅需單顆 RGB 攝影機,即可在各類邊緣設備上實現即時動作擷取與姿勢辨識,無需額外硬體輔助。Red Pill Lab 的解決方案廣泛應用於動作追蹤、手勢控制、智慧復健、互動教育等領域。相較於市面上主流工具如 Google MediaPipe,VideoPose 在多數平台上可實現高出近 10 FPS 的運行效率,展現卓越的運算表現與資源優化能力。
以 Red Pill Lab 於去年推出的 HandTrack 模型為例,訓練團隊蒐集了120萬筆已標註之手部資料,結合2D與3D資訊進行混合式建模與訓練。模型首先透過PyTorch完成訓練,再進行優化與格式轉換為TensorFlow Lite,最終順利部署於各類基於Arm架構的手持與邊緣裝置上,實現高精度的 3D手部骨架追蹤。後續可應用於各類人機互動場景,例如透過手機前鏡頭控制Netflix UI,展現無需額外硬體的即時手勢操作能力。

Red Pill Lab 2D 轉 3D 手勢偵測模型訓練流程
目前,Red Pill Lab 所開發之技術已全面支援 Windows on Arm、Android、iOS 與 Linux 等Powered by Arm平台,契合行動運算與邊緣 AI 的快速發展趨勢。同時Red Pill Lab正以前瞻視野與技術實力,重新定義人體動作理解之技術邊界。

Red Pill Lab 基於 Arm 硬體之手部追蹤模型架構
CyberLink AI 影音編輯軟體

訊連科技(CyberLink) 資深產品經理Elvis Chen
訊連科技CyberLink [8] 為全球知名的多媒體與人工智慧軟體開發商,旗下產品包括 AI 影音編輯軟體「威力導演(PowerDirector)」、AI 照片編修工具「相片大師(PhotoDirector)」以及數位行銷設計平台「Promeo」,致力於提供創作者專業且直覺的編輯體驗。

CyberLink 產品線
由於軟體技術內容涉及大量影音計算,故如何讓軟體遷移到不同硬體加速運行就變成其重大挑戰,尤其是新一代 AI PC 採用 Windows on Arm (WoA) 架構,會面臨更多挑戰。
目前在 WoA 下,威力導演中已導入數種 AI 解決方案,包括物件追蹤、身體特效及臉部模糊等。經分析視訊硬體編解碼在 H.265, FHD(1920×1080), 29.97FPS 下,CPU 加速後可達 39.83 FPS, GPU 加速更可達 75.36 FPS,整體效能提高為 1.8 倍。
在相片大師中,FHD(1920×1080) 影像放大(超解析度) 4 倍時,CPU 僅需 1.61 秒,而 GPU 在 1.25 秒就能完成,整體效能提高為 1.29 倍。
最後展示 Promeo 自動去背功能,對 30 張800×600 解析度影像進行物件去背,CPU 僅需 123 秒,而 GPU 65 秒就能完成,整體效能提高為 1.89 倍。

CyberLink PowerDirector & Promeo 在WoA下執行效果及效能分析
Arm KleidiAI & MNN
2022年底開啟了大語言模型(LLM)時代,2024年各種多模態模型(Multimodal)紛紛投入,讓文字、語音、影像、影片不再拘泥單一輸入或輸出。雖然在雲端應用可讓使用者充份得到滿足,但對邊緣裝置端則出現極大挑戰。
Arm 為了讓 CPU 在 AI 的效能可以充份發揮,同時讓開發者能更簡單開發 AI 相關應用,於是推出了 Arm Kleidi [9]。
Arm KleidiAI 有別於傳統 Arm Compute Library (ACL),它被稱為 Micro Kernel,是一群被優化過的核心計算函式庫,可充份發揮硬體加速效能,尤其對 Arm Neoverse CPU 指令集(如 NEON, SVE, SME …)有更好的表現。
目前可支援多種常見框架及知名 LLM 模型,如PyTorch / ExecuTorch 下的 Lllama, Llama.cpp 下的 Phi3, Llama 3, MediaPipe Gemma 等。對於 Vision Transformer(ViT) 亦有不錯的支援性。

Arm Neoverse硬體與AI開發軟體及KleidiAI關係圖
當然這樣 Micro Kernel 也很適合直接呼叫使用,讓開發者更有彈性,能發揮出更高效能。像 Alibaba MNN [10] 就已將 KleidiAI 整合進去。
最後展示了在 Vision Trasformer (ViT) 應用下,開啟和關閉 Arm KleidiAI 的差異,可得知開啟後有明顯效能提升。雖然目前這項技術僅限於 Arm Neoverse CPU,但未來有機會延伸至 GPU,這樣就能獲得更大幅度的 AI 推論效能提升。

ViT應用使用Arm Kleidi AI之性能比較
小結
在此次專為開發者舉辦的 Arm Developer Experience 技術演講 中,Arm 不僅帶來很多嶄新技術及未來願景,更對開發者社群投注更多的關心及技術支援,讓 Arm 不再只是單純矽智財(Silicon Intellectual Property, SIP)提供者。伴隨著越來越多的軟體開源工具、豐富的學習文件及完整的線上社群、論壇成立,相信 Arm 的智慧軟體開發生態系(AI Software Ecosystem)一定可以迅速茁壯成為開發者的最大助力。
最後,我鼓勵開發者加入 Arm 開發人員計畫,讓 Arm 協助您擴展技能、人脈網絡,一起建構未來! 請點此加入:連結
參考連結
[1] Arm 開發人員計畫 (Arm Developer Program)
https://pse.is/7ncedn
[2] Arm Developer Hub – Learning Path
https://learn.arm.com
[3] Arm 推出精確超解析度 (ASR) 圖像提升技術
https://www.arm.com/zh-TW/resources/blueprint/introducing-arm-accuracy-super-resolution
[4] Arm 開發工具與軟體 – Arm Performance Studio
https://www.arm.com/zh-TW/products/development-tools/graphics/arm-performance-studio
[5] Developer Hub – Arm Performance Studio
https://developer.arm.com/Tools and Software/Arm Performance Studio
[6] Developer Hub – Frame Advisor
https://developer.arm.com/Tools and Software/Frame Advisor
[7] Red Pill Lab 成境科技
https://www.rplab.ai/zh/
[8] CyberLink 訊連科技
https://tw.cyberlink.com/index_zh_TW.html
[9] Arm 開發工具與軟體 – Arm Kleidi
https://www.arm.com/zh-TW/products/development-tools/embedded-and-software/kleidi-libraries
[10] Alibaba – MNN介紹
https://mnn-docs.readthedocs.io/en/latest/intro/about.html
- Arm架構引領行動運算新典範:開發者無痛轉移密技大公開 - 2025/05/29
- 輕鬆用Intel AI PC及OpenVINO建立數位分身 - 2025/03/27
- 【Edge AI專欄 】 如何使用 Gradio 快速搭建人工智慧應用圖形化人機介面 - 2024/12/23
訂閱MakerPRO知識充電報
與40000位開發者一同掌握科技創新的技術資訊!