|

自己動手做AI:Google AIY開發套件解析

   

作者:陸向陽

今(2018)年國際消費性電子展上,最明顯的一個趨勢是Amazon與Google的語音技術進駐戰,如Amazon Alexa進駐到Acer筆電內,Google Assist進駐到KIA汽車內,其他如智慧電視、智慧喇叭,乃至傳統數位錄放影機TiVo都成為搶佔進駐的對象。

Google Assistant (圖片來源

語音辨識進駐大戰

這是一波新的搶灘戰,過去Google具有PC上網的搜尋入口優勢,使Google賺取龐大的廣告仲介收益。但上網的形式在改變,包含走動時對手機「說」、客廳躺臥時對智慧喇叭「說」、或開車時對行車電腦「說」,都要得到搜尋回應,而且是語音回應,這就成了語音辨識進駐大戰的開端,而且比過去的搜尋引擎更激烈。搜尋引擎一次還可以顯現三、五個結果選項,但語音回應只能逐一唸,聽完前三個大概就沒耐性了,所以第一個回應的答案,將更為重要。

為了讓自家的語音辨識、認知運算、人工智慧等技術更普及,Amazon與Google也推出相關套件,並盡可能平價供應給有興趣體驗的開發人員,例如2016年6月Amazon即以樹莓派電腦(RPi 2 Model B)為基礎搭配其Alexa軟體,就可模組出Amazon Echo的效果,並進行相關開發(詳細資訊可參考這裡)。

Google智慧語音,強勢出擊

Voice Kit(圖片來源

去年,Google也推出開發類似的套件,稱為AIY,取自人工智慧的AI(Artificial Intelligence),與自己動手做的DIY(Do It Yourself)兩字合併而成,意指自己動手做的人工智慧套件。Google率先推出語音版本的套件,即Google AIY Voice Kit,而後也推出視覺版本的套件Google AIY Vision Kit。

Google AIY或許受到Amazon的啟發,所以也是以樹莓派電腦為基礎,再搭上必要的硬體週邊與零件,構成最基本需求的語音、視覺辨識開發裝置,同時也可能受到IBM發起的TJBot專案(同樣是以樹莓派為基礎的語音辨識、人工智慧應用裝置)所影響,追加了紙板外殼與簡單的互動介面,例如會三色發光的LED燈號與按鈕,但並沒有TJBot的擺動手臂(用伺服馬達驅動)。

Google推出第一套語音版時(稱為V1),所搭配使用的樹莓派電腦仍是一般最普及常見的Model B(樹莓派3),價格比較高,約35美元。但之後再推出的語音版及視覺版則改採了較便宜的Pi Zero W(無線版的Pi Zero),價格約10美元。

無論視覺版或語音版套件都包含了樹莓派在裡頭,也包含了樹莓派所需要的MicroSD記憶卡,另外若是視覺版還額外包含了樹莓派用的攝影機模組(V2版),如此語音版套件的價格約49.99美元,視覺版則為89.99美元。

視覺版 VS 語音版

既然視覺版與語音版有價差,那麼差在何處?事實上視覺版與語音版有一些相同的配件,如三色LED燈號、按鈕、GPIO接腳線路等,兩版本的主要差異在於:視覺版的介接板卡(稱為VisionBonnet board,語音版則稱為VoiceBonnet board)上多一顆影像處理人工智慧晶片,也稱為VPU(Vision Processing Unit視覺處理單元),即Intel Movidius MA2450,Movidius是Intel於2016年購併的業者。

視覺版(圖片來源

MA2450可以強化視覺運算,減輕樹莓派電腦的視覺運算負荷,同時還能執行神經網路的運算工作,此是視覺版要多貴出40美元的主因。當然!視覺版還有提供攝影機與攝影機上蓋護鏡,但同時沒有語音版的喇叭,取而代之的只有簡單的蜂鳴器。

語音版(圖片來源

由於語音運算明顯比視覺輕量,純耗用樹莓派電腦的運算力即可,不需要額外的加速運算晶片,因而成本與訂價可以低於視覺版。

Vision Kit的辨識模型簡介

值得注意的是,視覺版有附帶三套以TensorFlow為基礎的神經網路模型軟體:第一套是盤中物辨識,是採開放原始程式碼的神經網路模型專案MobileNets所建構成,可辨識上千個常見的生活用品;第二套可辨識出影像中的人臉,並透過臉部表情研判目前的心情愉悅度,打出愉悅分數;第三套則可辨識影像中何者為人、何者為貓、何者為狗。

此外官網還有列出其他的辨識模型,例如:辨識碗盤內放的東西為何物?辨識自然界的景物等,多數模型也是基於MobileNets所構成,但也有基於SqueezeNet所構成的模型。

視覺版中也附有編譯工具軟體,可以在工作站或雲端上,對模型進行訓練、再訓練等編譯。至於語音版,所附的軟體主要是Google Assist的軟體開發套件(SDK)與示範用應用程式(DEMO Application)。

其他配套也包含Google Play應用程式商店的賣架上可以找到Google AIY Projects的手機應用程式(App),可免費下載安裝使用,並搭配AIY硬體套件一起開發運用。

結語

Google在最後也出一些發想題,好激發大家的人工智慧開發撰寫動力,例如用視覺版套件開發出能辨識各種動植物的人工智慧軟體,辨識正在行駛的車子是否有偏離車道?辨識您的訪客是否滿意您家裡的節慶裝飾等,這些都期望能以視覺版套件的軟硬體為基礎,更快完成與實現。

(責任編輯:廖庭儀)

 

陸向陽
陸向陽

Author: 陸向陽

從電子科系畢業後,即以媒體人的角色繼續這段與「電子科技」的不解之緣。歷任電子技術專書作者、電子媒體記者、分析師等角色,並持續寫作不殆。近來投入Arduino、Raspberry Pi等開放硬體的研究與教程介紹。

Share This Post On

Submit a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *