解放AI創造力:OpenVINO開啟多模態生成式AI部署新篇章
在5月初舉辦的2025年第一場OpenVINO DevCON線上講座中,來自英特爾的專家講師除了詳細介紹2025年最新版本OpenVINO的功能更新,展示如何在多模態AI時代中,以更快、更輕量、更有效率的方式部署大語言與視覺生成模型,並透過實例說明如何構建適用於AI PC與邊緣裝置的智慧對話系統。
【Arm的AI世界】以ExecuTorch和KleidiAI執行LLM推論 充分釋放行動端AI潛力!
受惠於Arm和Meta工程團隊的協作,AI開發人員可在具有i8mm ISA擴展的基於Armv9架構之Arm Cortex-A CPU上部署Llama量化模型,運作速度最高可提升20%;本文將分享更多細節,包括…
從主控晶片檢視NVIDIA AIPC:DGX Spark、DGX Station
DGX Spark是NVIDIA倡議的AIPC參考設計,提供給各品牌系統商以此為基礎再行修改調整而後銷售,而除了DGX Spark外,NVIDIA也發表另一款AIPC參考設計:DGX Station,本篇文章會針對此兩款設計做簡單的介紹。
【創業小聚】從偷偷闖入牙技所到合作哈佛,Dentscape用AI逆襲牙科產業
Dentscape利用AI結合3D技術,推出假牙修復設計軟體,用來縮短牙技師製作假牙的時間。目前,Dentscape已經和哈佛牙醫學院達成合作,並在2024年完成新台幣2,000萬元的Pre-Seed輪募資!
用OpenVINO GenAI解鎖LLM極速推論:推測式解碼讓AI爆發潛能
借助簡化開發和最佳化硬體利用率的工具,OpenVINO使開發者能夠在各種即時和資源受限的場景中部署高性能的LLM;無論是構建回應迅速的聊天機器人或高效率虛擬助手,還是具備可擴展性的創意應用,OpenVINO正在重新定義AI推論的可能性。本文將探討如何利用OpenVINO GenAI的推測式解碼技術使這一變革性創新成為現實。