量化技術 | MakerPRO

|

Home » 量化技術

LLM如何「落地」？蒸餾、壓縮與微調技術比一比

8 月18

LLM如何「落地」？蒸餾、壓縮與微調技術比一比

Posted By owenou on 8 月 18, 2025 in SLM, 技術導讀, 量化技術

蒸餾聚焦「智慧遷移」、壓縮專注「資源優化」、微調強調「專業提升」，合力推動語言模型在多樣應用環境的高效落地，本文將剖析它們在技術架構與應用場景中的定位與相互關聯。

Read More

【Arm的AI世界】以ExecuTorch和KleidiAI執行LLM推論　充分釋放行動端AI潛力！

5 月02

【Arm的AI世界】以ExecuTorch和KleidiAI執行LLM推論　充分釋放行動端AI潛力！

Posted By Arm作者群 on 5 月 2, 2025 in Arm, Arm的AI世界, Edge AI開發地圖, LLM, 技術導讀, 技術新訊, 物聯網, 量化技術

受惠於Arm和Meta工程團隊的協作，AI開發人員可在具有i8mm ISA擴展的基於Armv9架構之Arm Cortex-A CPU上部署Llama量化模型，運作速度最高可提升20%；本文將分享更多細節，包括…

Read More

2025年CES展AI類創新獎觀察

1 月09

2025年CES展AI類創新獎觀察

Posted By 陸向陽 on 1 月 9, 2025 in AI關鍵技術, Edge AI, Edge AI應用案例, Edge AI開發地圖, 影像分割, 數位製造工具, 智慧城市, 智慧工廠, 智慧演算, 智慧醫療, 深度學習, 物件偵測, 特寫, 產業新訊, 量化技術, 陸向陽

每年一月的消費性電子展（CES）都會有創新獎的頒佈，雖然獎的頒佈有些浮濫，似乎在於增添展會氣勢，但有時有些獎確實具創意，值得參考，本文就人工智慧（AI）類的獲獎品進行進一步觀察。

Read More

【Edge AI專欄】當MCU遇上NPU能擦出什麼新火花？

7 月29

【Edge AI專欄】當MCU遇上NPU能擦出什麼新火花？

Posted By 許哲豪 on 7 月 29, 2024 in Edge AI, vMaker, 影像分割, 感測器, 案例研究, 物件偵測, 特寫, 量化技術, 開發主板, 開發套件, 開發工具

為了讓大家更了解 MCU 加上 Micro NPU 究竟能幫大家帶來什麼好處，本文就以Seeed Studio和奇景光電合作的 Grove Vision AI Module v2 開發板及 Seeed SenseCraft AI (TinyML) 開發平台，帶著大家一起來玩玩微型 AI 電腦視覺應用。

Read More

以LLaVA-NeXT和NNCF先進量化技術掌握多模態AI

6 月18

以LLaVA-NeXT和NNCF先進量化技術掌握多模態AI

Posted By OpenVINO作者群 on 6 月 18, 2024 in Edge AI, Edge AI開發地圖, Edge AI開發環境, Intel, LLM, OpenVINO, OpenVINO專欄, OpenVINO教學文, 教學文, 量化技術

在這篇文章中，我們將探索LLaVA-NeXT多模態聊天機器人Notebook，學習如何轉換和最佳化LLaVA-NeXT模型來打造多模態聊天機器人。此外，我們將探討如何在LLM部分應用有狀態轉換(stateful transformation)和使用NNCF進行權重壓縮和量化等模型最佳化技術。

Read More

【Arm的AI世界】以ExecuTorch與TOSA讓PyTorch在Arm平台順利運作

4 月22

【Arm的AI世界】以ExecuTorch與TOSA讓PyTorch在Arm平台順利運作

Posted By Arm作者群 on 4 月 22, 2024 in Arm, Arm的AI世界, Edge AI解決方案, Edge AI開發地圖, Edge AI開發環境, PyTorch, 專欄, 教學文, 量化技術

Arm與Meta密切合作在ExecuTorch導入對Arm裝置的初步支援，以Tensor運算子集架構(TOSA)為基礎擷取類神經網路，並利用Ethos NPU在行動及嵌入式平台加速關鍵的ML工作負載…快來了解如何使用PyTorch及ExecuTorch以TOSA將圖形匯出至Arm平台！

Read More

« Older Entries