從多模態到全模態:AI 邁向理解世界的下一步
Gemini 2.5 Pro、GPT-4o 與 Claude 3.7 Sonnet等模型正走向全模態這條路,而全模態模型的成熟,將成為通用人工智慧(AGI)是否可能實現的關鍵里程碑。
資策會MIC:AI Agent將開啟全新數位勞動力時代
資策會產業情報研究所(MIC)在日前一場研討會上探討AI Agent趨勢並分析其商業應用發展,指出AI Agent新創的融資規模與交易量在2024年雙雙創下新高,資金主要流向商業應用場景,預期未來AI Agent將重塑企業的工作模式與商業互動格局。
【Arm的AI世界】以ExecuTorch和KleidiAI執行LLM推論 充分釋放行動端AI潛力!
受惠於Arm和Meta工程團隊的協作,AI開發人員可在具有i8mm ISA擴展的基於Armv9架構之Arm Cortex-A CPU上部署Llama量化模型,運作速度最高可提升20%;本文將分享更多細節,包括…
NVIDIA與Google的通用機器人AI技術是競爭或互補?
NVIDIA與Google持續提出通用型機器人AI(Generalist Robot AI)架構,本文將從兩者的相似性與互補性進行探討,以提供對通用機器人AI合作與融合可能性的分析展望。
YOLOv12的改變:向Transformer、Attention靠攏!
最新版本 的YOLOv12延續了 YOLO 系列一貫的「高速 + 準確」的設計理念,但在架構、訓練方法與推論效率方面均有顯著改進,並且更加靠近 transformer 技術與多模態學習的整合,本文將做個介紹。