以LLaVA-NeXT和NNCF先進量化技術掌握多模態AI
在這篇文章中,我們將探索LLaVA-NeXT多模態聊天機器人Notebook,學習如何轉換和最佳化LLaVA-NeXT模型來打造多模態聊天機器人。此外,我們將探討如何在LLM部分應用有狀態轉換(stateful transformation)和使用NNCF進行權重壓縮和量化等模型最佳化技術。
【2024 MAI Talks】開發者如何選擇Edge AI開發方案?
Edge AI Taiwan版主Jack Hsu博士指出,從最小的晶片到高成本的伺服器解決方案,市場上的選擇豐富多樣。他強調了應用的多樣性和定制性,說明不同的計算需求和功耗會影響硬體選擇。
【2024 MAI Talks】Embedded ML殺手級應用與系統規劃
ALIF 亞洲區市場行銷協理Sampan Chen從公司背景、技術優勢、產品開發、客戶實例等面向分析「Embedded ML殺手級應用與系統規劃」。
LangChain框架已正式支援OpenVINO!
透過LangChain,開發者可以輕鬆構建基於RAG或者Agent流水線的複雜應用體系,而目前我們已經可以在LangChain 的關鍵元件LLM、Text Embedding和Reranker中直接呼叫OpenVINO進行模型部署!
【2024 MAI Talks】企業LLM落地關鍵:模型微型化技術
Deep Mentor CEO吳昕益分享了企業將大型語言模型(LLM)落地部署需要的關鍵技術,深入介紹模型微型化技術的特點。