這兩年人工智慧當道,無人自動駕駛汽車技術也隨之興起,我想超過四十歲的大叔們心中最完美的自駕車莫過於 1980 年代電視影集「霹靂遊俠」中李麥克開的那台「伙計」了。
「伙計」擁有高度人工智慧,不但可以自動駕駛,遇到狀況也會自動閃避,還可以輕鬆和人對話解決各種問題,李麥克拿起手表還可呼叫「伙計」開到指定地方,簡直就是現代人工智慧自駕車及語音助理的最佳範本!
不過自駕車這項技術聽起來就很難,那 Maker 們有沒有機會自己土砲一台呢?
1980 年代經典電視影集「霹靂遊俠」李麥克和人工智慧自駕車「伙計」(圖片來源)
說起自駕車(Autonomous Car)或是先進駕駛輔助系統(Advanced Driver Assistance Systems, ADAS)主要都是希望車輛在沒有人為操作下即可自動導航(GPS 衛星定位、路線規畫)、避障(閃避車輛、行人或異物)及環境感測(看懂燈號、路標),同時將使用者安全地帶到目的地。目前各國爭相投入研發資源,大到無人公車、卡車、貨櫃車,小到無人計程車、送貨車、電動輪椅甚至無人農業耕耘機、採收機,就是不想錯過新一波的交通革命。
在自駕車眾多技術中最不可缺少的一項就是電腦視覺技術,但要搞懂一大堆數學、人工智慧理論、程式撰寫方式、系統框架和硬體架構,還得懂得如何建立資料集、訓練及優化(加速)模型,這可就難倒大多數人了,難道就不能「快快樂樂學 AI」,站在巨人的肩膀上看世界嗎?
英特爾(Intel)為了讓大家能夠快速入門,因此提出了一項免費、跨硬體(CPU、 GPU、FPGA、ASIC)的開放電腦視覺推論及神經網路(深度學習)優化工具包「OpenVINO」(Open Visual Inference & Neural Network Optimization Toolkit),同時提供很多預先訓諫及優化好的神經網路模型可供大家直接使用。
影像辨識目標
在進入主題之前,首先要先認識一下影像辨識的常見項目及定義,如下圖所示:
A. 影像分類:一張影像原則上只能被分到一個類別,所以影像中最好只有一個主要物件。若影像中出現多個物件,那分類時則可能出現多個分類結果,同時會給出每個分類的不同機率,此時誤分類的可能性就會大大提昇。
B. 物件定位:一張影像中可同時出現多個相同或不同物件,大小不据,辨識後會對每個物件產生一個邊界框(Bounding Box),如此即可獲得較為準確的物件位置(座標)及尺寸(邊界框長寬)。
C. 語義分割:是一種像素級分類,意思就是每個像素都只會被歸到某一分類,如此就可取得接近物件真實邊界(Edge)。但缺點是多個相同物件類型的像素都會被分到同一類,當物件太靠近或部份重疊時就不易分清楚共有多少物件。
D. 實例分割:這也是一種像素級的分類,和語義分割的差別是相同類型的不同物件所屬像素就會被區分成不同分類(顏色),包括物件有部份重疊時,如此就能更正確判別影像中的內容。
只需不到短短一分鐘...
輸入您的信箱與ID註冊即可享有一切福利!
會員福利
免費電子報
會員搶先看
主題訂閱
好文收藏