讓機器人開始「思考下一步」的三個關鍵模型:ACT、RDT-1B和π₀
剖析 ACT、RDT-1B和π₀的發展,一個共同的核心事實逐漸清晰:機器人的智能正在從「控制」升級到「理解」與「生成」。
AI Agent時代來臨:看邊緣AI如何成為驅動智慧機器人的關鍵
仿生機器人由於型態各異,採用VLA架構將會需要一定的調整時間,不利於應用快速落地。此時使用代理架構,不僅運動部分僅需要依照各機體原生的SDK進行串接,也可導入各專業廠商成熟的軟體產品,作為代理可呼叫的行為工具,直接達成商用等級的機器人應用。
本地端高效、高畫質影片生成引擎來了:LTX-2
LTX-2 不只是另一款技術模型,它標誌著「生成式影片」從邊緣試驗進入「廣泛創作/實務應用」的時代。對 Edge AI 開發者而言,LTX-2 則代表生成式 AI 已逐步邁向「可在本地運行、低延遲、可整合於實際應用管線」的新階段。
【實作案例】以OpenVINO實現VLM、MLLM導入產業應用
本文從技術原理出發,結合理論與實測,展示了如何以Phi-3 Vision為核心模型,配合OpenVINO部署最佳化與YOLOv8偵測模組,建構可實際落地的多模態語言模型應用架構。