LLM | MakerPRO

1 月26

輕鬆利用OpenVINO結合LangChain與Llama2打造智慧小助手

Posted By OpenVINO作者群 on 1 月 26, 2024 in AIGC, ChatGPT, Edge AI, Edge AI教學文, Edge AI開發地圖, Edge AI開發環境, Hugging Face, Intel, Llama 2, LLM, ONNX, OpenVINO, OpenVINO專欄, OpenVINO教學文, 教學文

LLM大模型存在很多痛點，包括但不限於資料陳舊、無法和外部元件互動等，本文旨在使用 OpenVINO 2023.1新版本的特性加速Llama2模型，為Llama2客製化Prompt，並用LangChain 實現可連網取得最新消息的輔助搜尋功能

1 月15

【創業小聚】成立半年就成為獨角獸！法國新創Mistral AI用「完全開源」挑戰OpenAI

Posted By 創業小聚 on 1 月 15, 2024 in AIGC, AI關鍵技術, Llama 2, LLM, 案例研究, 特寫

2022年，OpenAI的GPT模型讓AI進入人們的生活，有了更多應用場景和機會。出於對OpenAI「閉源」的作法不認同，Mistral AI以完全授權的Apache 2.0授權方式開源新的LLM模型。

12 月18

運用BF16與NHWC技術實現進階版LLM微調訓練最佳化

Posted By 高煥堂 on 12 月 18, 2023 in Edge AI教學文, Edge AI開發地圖, Edge AI開發學習, LLM, OpenVINO專欄, OpenVINO應用, OpenVINO評測文, PyTorch, 教學文, 評測

本文要來介紹如何利用BF16半精度浮點數以及將影像資料設為NHWC格式兩項技術，來最佳化大型AI模型的訓練速度與記憶體節省，並延續以微調模型訓練為範例，透過完整程式碼來示範如何發揮這兩項新技術的用法和魅力。

12 月12

如何利用低位元量化技術進一步提升大模型推論性能

Posted By 楊亦誠 on 12 月 12, 2023 in AI關鍵技術, Edge AI教學文, Edge AI開發地圖, Edge AI開發學習, Intel, LLM, OpenVINO, OpenVINO專欄, 教學文, 量化技術

相比運算量的增加，大模型推論速度更容易受到記憶體頻寬的影響，導致算力資源無法得到充分發揮，進而影響性能；低位元量化技術是讓大語言模型(LLM)在部署過程中實現性能需求的最佳方案之一，本文將探討低位元量化技術如何幫助LLM提升性能，以及新版OpenVINO對於低位元量化技術的支援。

12 月05

活用IPEX和Intel GPU加速大型語言模型訓練效率

Posted By 高煥堂 on 12 月 5, 2023 in AI關鍵技術, Edge AI開發地圖, Edge AI開發環境, Intel, LLM, OpenVINO, OpenVINO專欄, PyTorch, 技術新訊, 評測, 開箱文

以IPEX (Intel-Extension-for-PyTorch)搭配Intel硬體產品，可提供最佳化功能大幅提升運作效能。例如透過PyTorch的裝置來發揮Intel GPU的潛能，加速AI模型的訓練和推論。本篇文章將說明如何善用上述兩項產品來實現效能的大幅提升，仍然以微調訓練的範例來展現它們的特性，並說明其使用方法和流程。

11 月29

利用Intel平台提升LLM微調與訓練效率：ResNet50+LoRA範例

Posted By 高煥堂 on 11 月 29, 2023 in Edge AI教學文, Edge AI開發地圖, Intel, LLM, LoRA, OpenVINO, OpenVINO專欄, OpenVINO教學文, OpenVINO評測文, 教學文, 開箱文

本文將說明如何善用英特爾(Intel)所研發的新產品和相關技術，來提升AI模型的訓練效率，以便提供更優質的推論功能。為了循序漸進介紹上述的新產品及其相關的使用技術，本文先從大家熟悉ResNet50圖像分類模型做為起步範例，並搭配LoRA來進行外掛訓練，以便從這簡單範例中充分理解如何活用上述的創新產品及相關技術。

輕鬆利用OpenVINO結合LangChain與Llama2打造智慧小助手

【創業小聚】成立半年就成為獨角獸！法國新創Mistral AI用「完全開源」挑戰OpenAI

運用BF16與NHWC技術實現進階版LLM微調訓練最佳化

如何利用低位元量化技術進一步提升大模型推論性能

活用IPEX和Intel GPU加速大型語言模型訓練效率

利用Intel平台提升LLM微調與訓練效率：ResNet50+LoRA範例

如何客製化企業 RAG 知識庫？— 從資料庫到知識整合的實戰技術

加入MakerPRO粉專

訂閱MakerPRO週報 !