玩轉 AI 機器人的新境界 – Now and Future
|
用OpenVINO C# API部署YOLOv9目標檢測和實例分割模型
4 月19

用OpenVINO C# API部署YOLOv9目標檢測和實例分割模型

YOLOv9模型是YOLO系列即時目標檢測演算法中的最新版本,代表著該系列在準確性、速度和效率方面的又一次重大飛躍。在本文中,我們將結合OpenVINO C# API使用最新發佈的OpenVINO 2024.0部署YOLOv9目標檢測和實例分割模型。

Read More
為AI/ML工作負載最佳化 Alif新推BLE MCU
4 月11

為AI/ML工作負載最佳化 Alif新推BLE MCU

Alif Semiconductor推出首款專為AI/ML工作負載最佳化硬體的藍牙低功耗(BLE)無線微控制器(MCU)新產品Balletto系列;能讓各大製造商能在真無線立體聲(TWS)耳機中採用,支援語音識別、自適應消除雜訊、人聲定位追蹤及波束成形等AI/ML功能,亦可於生活型智慧手環和其他受空間限制的裝置上實現感測器融合。

Read More
Arm新一代Ethos-U NPU與IoT參考設計平台亮相
4 月10

Arm新一代Ethos-U NPU與IoT參考設計平台亮相

Arm的嵌入式AI加速器Ethos-U系列NPU再添新成員U85;與上一代產品相比,Ethos-U85的效能號稱提升四倍,並提高了20%功耗效率…

Read More
以服務精神經營Edge AI市場 DeepMentor志在實現「模型經濟」
4 月08

以服務精神經營Edge AI市場 DeepMentor志在實現「模型經濟」

DeepMentor目前的解決方案,是以獨家的AI模型/演算法微型化軟體技術為基礎,搭配名為DeepLog的自有AI處理器(TPU)軟IP,以及DMAI系列AI加速硬體系統(Arm架構加速卡DMAI FPGA與Intel x86架構DMAI-700/900),提供涵蓋模型訓練、ASIC設計、嵌入式系統軟硬體整合的客製化Edge AI應用落地服務。

Read More
【Arm的AI世界】縮小Edge AI的技能落差
3 月29

【Arm的AI世界】縮小Edge AI的技能落差

希望運用新型AI和機器學習工作負載的邊緣AI開發團隊,大部分都面對技能落差的問題,導致團隊沒有足夠能力最佳化及加速裝置內的AI。所以有哪些關鍵落差持續存在?讓我們深入探討各個領域的挑戰以及解決方案。

Read More
Nvidia GTC 2024 提出的 FP8/FP4 如何加速AI訓練及推論
3 月27

Nvidia GTC 2024 提出的 FP8/FP4 如何加速AI訓練及推論

新一代 GPU Blackwell B200 在硬體端提供了 FP4 計算能力,單片就可達 20 petaFLOPS,二片 B200 組成的 GB200 在訓練性能是前一代 H100 的 4 倍,推論性能更高達 7 倍。若再將 36個 CPU 加上 72 個 GPU 組成「GB200 NVL72」超大型伺服器,則 FP8 訓練能力可高達 720 petaFLOPS, FP4 推論能力更高達1.44 exaFLOPS。而究竟什麼是 FP8 / FP4 呢?本篇文章會簡單幫大家科普一下。

Read More