從多模態到全模態:AI 邁向理解世界的下一步
Gemini 2.5 Pro、GPT-4o 與 Claude 3.7 Sonnet等模型正走向全模態這條路,而全模態模型的成熟,將成為通用人工智慧(AGI)是否可能實現的關鍵里程碑。
NVIDIA與Google的通用機器人AI技術是競爭或互補?
NVIDIA與Google持續提出通用型機器人AI(Generalist Robot AI)架構,本文將從兩者的相似性與互補性進行探討,以提供對通用機器人AI合作與融合可能性的分析展望。
訓練機器人互相學習:DeepMind 的 RT-X基礎模型
本文介紹由Google DeepMind主導推動的通用機器人AI基礎模型 – Robotic Transformer的先進模型:RT-X。
Super版NVIDIA Jetson Orin Nano到底多「超級」?技術專家揭密
瞬間成為熱門話題的Jetson Orin Nano Super到底有沒有那麼「超級」?MakerPRO攜手研華與「夜市小霸王」透過一場線上研討會,與將近400位聽眾分享了該系統的性能實測結果,以及VLM實際部署應用範例。
【AI知多少】單模態到多模態:LLM、VLM、Video-LM
從單模態的LLM出發,目前的AI正如火如荼朝向多模態模型發展,特別是處理語言 + 平面視覺或連續視覺的VLM及Video-LM模型,讓AI看圖說故事或說故事生影片的情境成真了。
【從科幻到現實】勾勒AI未來情境 (下) – 以假亂真的AI世界
本文要談的是AI如何讓「虛擬」與「現實」的界限更模糊了,其中生成式AI正是重要的推手,不僅造就了Digital Human,也讓元宇宙有機會成真。