賦予機器人眼球運動智慧的EyeVLM
為了更精準的智慧判斷,AI電腦視覺也應該跟人跟視訊監控一樣,是可以改變觀察方位角度與遠近的,為此上海交通大學以Qwen2.5-VL 7B為基礎延伸發展,開發出可用於機器人眼球智慧操作的AI模型,稱為EyeVLM。
AI工具讓視障者也能順利完成3D建模!
3D建模目前以OpenSCAD這套軟體最具代表性,從軟體名稱上也可瞭解這是一套開放、免費的軟體,因而被人廣泛使用,特別是在教育領域。對一般人而言使用OpenSCAD並無大礙,但對視障者而言則有困難…
TinyML突破!8-bit MCU、512Bytes也能電腦視覺AI
GitHub上有一名GiorgosXou帳號者提出NeuralNetwork Library For Microcontrollers函式庫,該函式庫運用各種技法讓AI模型縮小,例如量化(quantization)、SIMD加速、客製的激活函數(activation function)等,讓多種AI模型進一步縮小。
Gemini Robotics 1.5版觀察
Google以2.0版為基礎衍生發展出Gemini Robotics模型,Gemini Robotics 1.0於2025年3月發表,版本一樣快速推進,9月推出1.5版。無論是Gemini Robotics或Gemini Robotics-ER其實都是多模態模型,即輸入的內容型態不限一種,而是…
Qualcomm購併Arduino觀察
美國時間2025年10月7日Qualcomm宣佈購併Arduino,此購併未揭露交易價格,但承諾後續仍維持Arduino原有的中性發展立場。
以工程角度檢視NVIDIA Jetson Thor
有關NVIDIA Jetson Thor的規格已有相關報導,在此不贅述,筆者在此要討論的是Jetson Thor背後的實現工程,如同此前筆者曾討論過DGX Spark的GB10與DGX Station的GB300一樣。