【Arm的AI世界】以ExecuTorch和KleidiAI執行LLM推論 充分釋放行動端AI潛力!
受惠於Arm和Meta工程團隊的協作,AI開發人員可在具有i8mm ISA擴展的基於Armv9架構之Arm Cortex-A CPU上部署Llama量化模型,運作速度最高可提升20%;本文將分享更多細節,包括…
NVIDIA與Google的通用機器人AI技術是競爭或互補?
NVIDIA與Google持續提出通用型機器人AI(Generalist Robot AI)架構,本文將從兩者的相似性與互補性進行探討,以提供對通用機器人AI合作與融合可能性的分析展望。
訓練機器人互相學習:DeepMind 的 RT-X基礎模型
本文介紹由Google DeepMind主導推動的通用機器人AI基礎模型 – Robotic Transformer的先進模型:RT-X。
YOLOv12的改變:向Transformer、Attention靠攏!
最新版本 的YOLOv12延續了 YOLO 系列一貫的「高速 + 準確」的設計理念,但在架構、訓練方法與推論效率方面均有顯著改進,並且更加靠近 transformer 技術與多模態學習的整合,本文將做個介紹。
用OpenVINO GenAI解鎖LLM極速推論:推測式解碼讓AI爆發潛能
借助簡化開發和最佳化硬體利用率的工具,OpenVINO使開發者能夠在各種即時和資源受限的場景中部署高性能的LLM;無論是構建回應迅速的聊天機器人或高效率虛擬助手,還是具備可擴展性的創意應用,OpenVINO正在重新定義AI推論的可能性。本文將探討如何利用OpenVINO GenAI的推測式解碼技術使這一變革性創新成為現實。
用Yocto Project打造輕量、客製化、高性能的 AI 邊緣系統
如果想打造輕量、可客製化、高性能的 AI 邊緣系統,Yocto Project 是其中的一個選擇。本文介紹Yocto支援主流AI運算架構現況及整合AI開發案例。