|

【活動報導】運用OpenVINO進入AI世界

   

作者:賴佩萱

這幾年來 AI 成為火紅的話題,許多企業與 Maker 都開始著手開發 AI 的相關應用,但模型訓練完後,該如何選擇合適的推論平台?每使用一個平台就必須重新再開發一次嗎?有沒有更簡單的開發環境或加速工具呢?

由建智股份有限公司(Sertek)主辦、Intel 協辦、MakerPRO 執行的 《OpenVINO 邊緣運算技術論壇》於 6 月 26 日邀請 到Sertek  FAE 藍國育、奕瑞科技(eRaySecure)副總經理周詩涵、歐尼克斯實境互動工作室創辦人許哲豪、QNAP 軟體工程師曾婉茹四位講者與大家分享 OpenVINO 的技術特色與實際應用,吸引許多關注 AI 開發環境與邊緣運算技術應用的人士參與。

認識邊緣運算神器 OpenVINO 

「什麼是 AI?」OpenVINO 的主要推手 — Sertek FAE 藍國育開頭即拋出這個關鍵問題,他表示,AI基本上就是由智慧人工去做服務,過去影像辨識的正確率只有 70 %,現在已提升至 95 %,目前電腦視覺儼然成為物聯網應用技術相當重要的環節,在產業上皆有相當廣泛的應用。

Sertek FAE 藍國育講解 Intel 的產品架構(攝影:劉庭芸)

他說明,開發AI 應用時,有足夠運算能力才能在最快速的時間內獲得最正確答案,而隨著物聯網發展而帶動的邊緣運算,OpenVINO 能使邊緣運算裝置獲得開放架構的視覺分析能力,並且銜接基於端點的軟硬體或雲端的深度學習效果,讓物聯網裝置能透過電腦視覺分析的判斷結果,執行對應的處理模式。

OpenVINO 的特色在於其整合了電腦視覺與影像處理工具 OpenCV、電腦視覺 API 標準 OpenVX、開放計算語言 OpenCL 等開源軟體工具,且相容於市場上主流的 AI 學習框架,如 Caffe、TensorFlow、Mxnet、ONNX 等,同時支援自家的 CPU、GPU、FPGA、VPU 等硬體加速晶片,此外 Intel 更提供 40 多組預先訓諫及優化好的神經網路模型讓大眾使用,目的便是期望協助開發者能以更簡單快速的方式,將邊緣、物聯網裝置搜集的影像資料,轉換成有商業價值的資訊。

AI 智慧影像辨識協助工廠作業

奕瑞科技副總經理周詩涵分享表示:「AI 最大的價值在於『預測』,例如在許多公安或危險的場合,只要能爭取更多時間便能避免意外的發生。」

奕瑞科技副總經理周詩涵指出 AI 的最大價值在於「預測」(攝影:劉庭芸)

周詩涵說,該公司致力於發展「客製化的影像辨識」,並將工廠設為目標客戶,許多解決方案都是多次拜訪工廠實勘,發現問題後開發的。舉例來說,在公安方面,一個營造公司會有鷹架、水電等各個不同的包商,於是該公司開發出能辨識進出人員的身分、隸屬的包商的人臉辨識系統,甚至連所需穿著的裝備也可檢查,確認齊全才得以進入工地工作。

另一個例子是有泰國客戶擔心產線員工怠慢而導致工廠產線塞車,便利用辨識系統監控產線進度及作業員的工作狀況;還有一個客戶的工廠一個月要送出八十萬包的物品,誤送將招致時間、金錢等各方面的成本,同時也毀損商譽,因此為客戶開發了智慧倉儲定位系統,利用影像辨識協助出貨正確性的比對。

運用 OpenVINO 開發自駕車視覺系統

歐尼克斯實境互動工作室創辦人許哲豪在「視覺運算」領域深耕多年,他笑說自己在 OpenCV 尚未問世的年代即開始寫視覺檢測程式,本次主要透過自駕車帶出視覺與感測的基礎,分享對自駕車視覺系統的研究心得。

歐尼克斯實境互動工作室創辦人許哲豪分享自駕車視覺系統的研究心得(攝影:劉庭芸)

許哲豪提及,目前各國爭相投入自駕車研發,自駕車大致必須遵循自動機工程學會 SAE 的規範,目前實際上能落地的屬於先進駕駛輔助系統(ADAS),主要藉由感應器或雷達,輔助駕駛,提升道路行駛安全。他說明,自駕車最複雜的感測器當屬視覺,因為其計算量非常大,視覺資料的取得也很麻煩的,不過網路上已有一些自駕車的影像資料集可供參考,如 BDD100K、ApolloScape、KITTI、CityScapes 等。

在 OpenVINO 應用方面,許哲豪列出了幾項 OpenVINO 提供的交通類辨識模型,如車輛偵測、行人及車輛偵測、車牌辨識、車輛屬性辨識、街景語義分割等;他也建議大家在使用模型時,模型混合越多運算速度會越慢,與其同時跑好幾個,不如將所有資料都抓來,整合後再一次訓練。

OpenVINO 技術整合實戰 — QuMagie

QNAP 威聯通科技軟體工程師曾婉茹分享團隊開發照片辨識 App — QuMagie 的開發心路歷程,她提及,團隊起初想做的是「多標籤的照片辨識」(e.g. 壽司的圖片必須有壽司、日本料理、米飯、餐點等數個標籤),且標籤分類必須符合普遍性集在地化,但由於 OpenVINO 沒有這類的模型,最後是由團隊自行訓練模型再導入 OpenVINO 做推論。

QNAP 威聯通科技軟體工程師曾婉茹談論 QuMagie 的開發歷程(攝影:劉庭芸)

為何選擇 OpenVINO 呢?曾婉茹說,因為 OpenVINO 不需要額外的成本就能加速硬體的運算,但在開發的過程團隊也有一些有趣的發現,像是在 FP16 與 FP32 的精度選擇上,對於一些圖片僅有些微的差異,以及原先利用 PYTORCH 訓練模型,但導入 OpenVINO 後發現辨識結果不太準確,原因竟與 RGB、BGR 的圖層設定有關。

QuMagie 已於今年的 CES 發表,主要整合了 AI 深度學習演算法,並可處理人臉及物件的辨識,另提供各式篩選器,讓使用者能依據眾多標籤,如拍照地點、人物、日期、照片名稱等方式,搜尋照片,甚至也可使用「包含」及「排除」做進階篩選,縮小搜尋範圍。

小結

OpenVINO 相容各人工智慧框架、整合眾多開源軟體工具、支援常見的硬體,以及提供訓練模型的特色,成為目前許多企業開發 AI 應用的新選擇,同時也讓許多不懂電腦視覺與深度學習原理的人可輕鬆上手,相信透過本場論壇的分享,與會來賓對於 OpenVINO 有更深入的認識,也對其應用領域為之一亮,期待未來有更創新的開發。

(責任編輯:楊子嫻)

PeiHsuan Lai
Lai PeiHsuan

Author: PeiHsuan Lai

喜歡用文字記錄生活、書寫故事,期望能用簡單易懂的文字闡述艱澀的科技議題、透過細膩的觀察與有溫度的筆觸,傳達 Maker 充滿熱忱的精神,

Share This Post On

Submit a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *