大語言模型 | MakerPRO

Home » Posts Tagged "大語言模型"

12 月12

如何利用低位元量化技術進一步提升大模型推論性能

Posted By 楊亦誠 on 12 月 12, 2023 in AI關鍵技術, Edge AI教學文, Edge AI開發地圖, Edge AI開發學習, Intel, LLM, OpenVINO, OpenVINO專欄, 教學文, 量化技術

相比運算量的增加，大模型推論速度更容易受到記憶體頻寬的影響，導致算力資源無法得到充分發揮，進而影響性能；低位元量化技術是讓大語言模型(LLM)在部署過程中實現性能需求的最佳方案之一，本文將探討低位元量化技術如何幫助LLM提升性能，以及新版OpenVINO對於低位元量化技術的支援。

11 月29

利用Intel平台提升LLM微調與訓練效率：ResNet50+LoRA範例

Posted By 高煥堂 on 11 月 29, 2023 in Edge AI教學文, Edge AI開發地圖, Intel, LLM, LoRA, OpenVINO, OpenVINO專欄, OpenVINO教學文, OpenVINO評測文, 教學文, 開箱文

本文將說明如何善用英特爾(Intel)所研發的新產品和相關技術，來提升AI模型的訓練效率，以便提供更優質的推論功能。為了循序漸進介紹上述的新產品及其相關的使用技術，本文先從大家熟悉ResNet50圖像分類模型做為起步範例，並搭配LoRA來進行外掛訓練，以便從這簡單範例中充分理解如何活用上述的創新產品及相關技術。

Next Entries »

如何利用低位元量化技術進一步提升大模型推論性能

利用Intel平台提升LLM微調與訓練效率：ResNet50+LoRA範例

加入MakerPRO粉專

訂閱MakerPRO週報 !