【開箱實測】OpenVINO榨出單板極限,實作離線LLM AI助理!
在當前AI PC問世之際,相信不少人已知道OpenVINO可以加速離線大語言模型(LLM)的推論速度,本篇文章是要更進一步在資源更為受限的單板電腦上進行大語言模型的推論,甚至是實作一個離線大語言模型的AI助理出來!
【Arm的AI世界】針對Helium應使用哪個工具鏈?
Arm Helium技術是Arm Cortex-M處理器產品系列的向量擴充(MVE),它可以為小型的嵌入式裝置,針對機器學習(ML)與數位訊號處理(DSP)應用,帶來顯著的效能提升。Helium可協助克服許多應用項目的運算挑戰…
【Maker電子學】Flash 記憶體的原理與應用—PART5(NAND flash)
本篇文章介紹 NAND flash 的電路結構,說明它如何將 flash memory 的密度提高到另一個境界。
以LLaVA-NeXT和NNCF先進量化技術掌握多模態AI
在這篇文章中,我們將探索LLaVA-NeXT多模態聊天機器人Notebook,學習如何轉換和最佳化LLaVA-NeXT模型來打造多模態聊天機器人。此外,我們將探討如何在LLM部分應用有狀態轉換(stateful transformation)和使用NNCF進行權重壓縮和量化等模型最佳化技術。