【CAVEDU講堂】AI影像辨識福音 – 含螢幕的鏡頭模組 HuskyLens

作者:CAVEDU 教育團隊

手中有 Arduino、micro:bit 的使用者,想要嘗試 AI 影像辨識與訓練自己的物體偵測模型,現在又多了一個選擇,那就是 DFRobot 公司在 Kickstarter 募資的 HuskyLens,它內建常見的影像演算法如物體辨識及追蹤、臉部辨識、循線、顏色辨識、標籤辨識。

想訓練 HuskyLens 辨識新物件,只需要像相機一樣按下按鈕就可以儲存影像以及框選新物體範圍。其內含的 2.0 英吋螢幕,用於顯示即時影像及操作介面,讓使用者能選擇要使用的演算法、調整設定、或是確認辨識效果,過程中不需要使用電腦。

(圖片來源:source

之前聽過李飛飛教授 TED 上的演講,講述如何教導電腦看懂圖像,他說小嬰兒呱呱墜地後,他們的眼睛就如同生物相機一樣,每 200 毫秒就拍一張照片,蒐集數以百萬計的照片來學習辨識事物的能力。而這篇要介紹的 DFRobot 公司的 HuskyLens 鏡頭模組,有別於一般的相機僅能攝影或錄影,它不需要搭配複雜的演算法便可以透過拍攝的影像來學習,它使用 AI 功能的晶片 Kendryte K210,讓你可以輕鬆的按按鈕拍照來教它認識物體、臉部辨識、以及顏色辨識。

而且 HuskyLens 本身有 2.0 英吋的螢幕,可以顯示即時影像確認是否辨識成功及操作介面提供使用者選擇要使用的演算法與調整設定,不需要使用電腦調整任何參數。使用 HuskyLens 內建的多種演算法,除了可以拍照片讓它認識並記錄不同的物體,讓 HuskyLens 從不同角度或不同遠近距離來拍攝同一物體的各種影像,收集越多的影像,它的辨識就會越準確。

HuskyLens 擁有的演算法如下:

  • 物體追蹤 Object Tracking
  • 臉部辨識 Face Recognition
  • 物體辨識 Object Recognition
  • 循線 Line Tracking
  • 顏色辨識 Color Recognition
  • 標籤辨識 Tag Recognition

(圖片來源:source

除了擁有上述的多種演算法之外,HuskyLens 還可以同時運行這些演算法,例如你可以做一台智能小車,讓它除了能沿著黑線循線行進之外,還可以辨識行進過程中看到的標籤,並根據標籤類別決定轉向方向。

在硬體規格方面,鏡頭分成 200 萬像素的基礎版(29 CAD,約 687 NTD)跟 500 萬像素 (65 CAD,約 1594 NTD)的進階版這兩種。在這樣的像素下能以 30 fps 的速度來做偵測。

更重要的是,HuskyLens 使用 UART 埠通訊,除了能應用在嵌入式開發板 Raspberry Pi、LattePanda 上之外,也可以用在微控制板 Arduino 跟 micro:bit 上,讓使用者可以不使用複雜程式的情況下,快速且有效的做出各式各樣的作品。其他詳細規格可以參考 HuskyLens 在 kickstarter 募資的介紹

(圖片來源:source

HuskyLens 的功能多到令人心動,可以做很多有趣的專題:小編學生時代一直很想做的火影忍者結印解鎖門禁(手勢辨識控制)、耳熟能詳的自走車(循線)、課堂或公司自動影像點名打卡(臉部辨識)、放在野外協助野生動物偵測及標定(物體辨識)、發票對獎(數字辨識)、結合上述的各種演算法建立強大的智能機器人助理、製作大型互動式裝置藝術等等,等待你去進一步探索。

(圖片來源:source

當然除了讚嘆 HuskyLens 的厲害程度之外,也必須跟市面上已有的產品做一下比較。大師級的人可以直接買 AI 專用晶片 Kendryte K210 來使用,Github 上也有詳細的 datasheet 。Arduino 的使用者原先可能有些人有碰過 ESP32-CAM (約435 NTD)或是 Pixy2,又稱CMUcam5(Amazon 上賣 59.9 USD,約1866 NTD,2014年發行)。

ESP32 可以搭配 Arduino 透過它建立的 stream server 來做基礎影像處理以及辨識,也有臉部辨識功能,但框選範圍品質普通。最新的 Pixy2 可以搭配 Arduino/Raspberry Pi/BeagleBone Black/LEGO Mindstorms EV3,擷取影像的更新速率是 60fps,能使用內建的資料庫偵測上百種物件、會自動追蹤偵測到的物件、做顏色追蹤跟循線、也可以訓練他辨識新的物體。官方有提供 PixyMon 讓使用者可以在電腦上查看影像處理的結果。

另外有一個宣傳概念類似的產品,JeVois A33 Smart Machine Vision Camera(49.99 USD,約1557 NTD,2017年發行),自帶降溫風扇,可以接 SD 卡讓你可以裝作業系統、JeVois 軟體、下載 TensorFlow 等演算法以及儲存資料。這個產品預設的競爭對手是 Raspberry Pi 3 Model B,主打麻雀雖小五臟俱全,CPU 有 1.35GHz,但 Ram 只有 256MB DDR3-1600。鏡頭部分使用最高的 1280×1024 解析度下能有 15fps 的影像更新速率。可以接 Arduino/Raspberry Pi,或是接電腦使用。產品定位比較接近用途多樣化。

綜上所述,HuskyLens 是一個性價比高且能讓你快速開發 AI 互動專案的鏡頭模組,推薦大家有機會可以買來玩玩看!

(上述商品價格按照文章撰寫當下匯率做換算)

(本文轉載自 CAVEDU 教育團隊原文連結;責任編輯:楊子嫻)

CAVEDU 教育團隊

CAVEDU 教育團隊是由一群對教育充滿熱情的大孩子所組成的機器人科學教育團隊。致力推動國內機器人教育。
CAVEDU 教育團隊

Author: CAVEDU 教育團隊

CAVEDU 教育團隊是由一群對教育充滿熱情的大孩子所組成的機器人科學教育團隊。致力推動國內機器人教育。

Share This Post On

Submit a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *