|
為Edge AI而生的SLM:TinyLlama
11 月28

為Edge AI而生的SLM:TinyLlama

TinyLlama 2 作為一個SLM小型語言模型,特別適合資源受限的嵌入式系統和邊緣運算環境。

Read More
想加速RAG開發?你需認識LLamaIndex框架
11 月21

想加速RAG開發?你需認識LLamaIndex框架

LLamaIndex 是 RAG 系統中不可或缺的基礎工具,專注於高效資料檢索與管理,本文將介紹兩者之間的技術關聯性。

Read More
【Arm的AI世界】Kleidi助力開發人員加速AI創新
6 月27

【Arm的AI世界】Kleidi助力開發人員加速AI創新

Arm Kleidi是一項廣泛的軟體和軟體社群參與計畫,目的在於加速AI發展。首先推出運用於熱門AI框架的Arm Kleidi軟體函式庫,開發人員可以直接取得Arm CPU出色的AI功能;而如今全球從雲端到邊緣的大多數AI推論工作負載,都在這些Arm CPU上執行。

Read More
【2024 MAI Talks】陳縕儂:打造台版LLM的理由與挑戰
5 月29

【2024 MAI Talks】陳縕儂:打造台版LLM的理由與挑戰

在台大資工系陳縕儂副教授主講的「打造台版LLM的理由與挑戰」演講中,主要討論了建立台灣版大型語言模型(LLM)的必要性及挑戰,並分享了她和她的學生在這方面的努力和成果。

Read More
輕鬆使用OpenVINO在本地裝置離線運作Llama3
5 月06

輕鬆使用OpenVINO在本地裝置離線運作Llama3

利用OpenVINO部署Llama3到本地運算資源,例如AI PC,不僅意味著更快的回應速度和更低的運作成本,還能有效地保護資料安全,防止敏感資訊外洩。這對於需要處理高度敏感性資料的應用場景尤其重要,如醫療、金融和個人助理等領域。本文將介紹如何使用OpenVINO對Llama3模型進行最佳化和推論加速,並將其部署在本地裝置上,進行更快、更智慧的AI推論。

Read More
以服務精神經營Edge AI市場 DeepMentor志在實現「模型經濟」
4 月08

以服務精神經營Edge AI市場 DeepMentor志在實現「模型經濟」

DeepMentor目前的解決方案,是以獨家的AI模型/演算法微型化軟體技術為基礎,搭配名為DeepLog的自有AI處理器(TPU)軟IP,以及DMAI系列AI加速硬體系統(Arm架構加速卡DMAI FPGA與Intel x86架構DMAI-700/900),提供涵蓋模型訓練、ASIC設計、嵌入式系統軟硬體整合的客製化Edge AI應用落地服務。

Read More