|

【視覺進化論】AI智慧視覺運算技術論壇 — OpenVINO面面觀

   

作者:Ryan Hu

這場技術論壇主要探討如何以低成本建構視覺解決方案,來建構從網路邊緣到雲端的視訊分析與深度學習,進而獲取有價值的商業情資,並讓智慧視覺的技術帶來更多創新應用與商機。

最近全球興起AI熱潮,在業界的應用中,視覺的智慧應用無疑是快速成長的一個領域,涵蓋了民生、工業、建築、交通等各個層面。然而,很多業者想引進AI視覺應用,都卡在投入的時間與成本太高,因而卻步,為此Sertek特別舉辦了這場《AI智慧視覺運算技術論壇》,邀集了多位專家共聚一堂,一同探討如何以低成本建構視覺解決方案,來建構從網路邊緣到雲端的視訊分析與深度學習,進而獲取有價值的商業情資,並讓智慧視覺的技術帶來更多創新應用與商機。

勢在必行的邊緣運算

論壇一開始,Intel資深亞洲區物聯網業務開發經理桑和崇指出邊緣運算正在崛起,並以中國的「天網」作為例子:目前中國在天網的架構下實際佈建 的攝影機數目已經到達 1 億 7000 多萬支,在 2020 年預計會增加到 4 億隻,若是影像全部都上雲端,頻寬必定是個大問題。因此他強調「網路勢必要變得更強大,每個節點都將有運算的能力以及智能」,這也突顯了邊緣運算未來發展的重要性。

桑經理提到:「當80% 的網路流量都來自影像時,如何有效處理這些影像的資料是個值得探討的問題。」畢竟實際有用的影像資料有限,若全數上傳雲端實在浪費頻寬。換句話說,在網路邊緣必須過濾出有效的資料,增加節點智能勢在必行。

桑和崇經理強調邊緣運算在影像辨識中的重要性(攝影:杜志賢)

接續邊緣運算探討後,主線來到電腦視覺(Computer Vision, CV) 和深度學習(Deep Learning, DL)的比較,過去是用傳統的 CV來處理影像,在判斷精準上遠遠不及 Deep learning 的效果,桑崇和簡單用在跳舞的舞者的一張照片為例,CV 辨識的是鳥,而 DL 卻能辨識出人眼看到的舞者樣貌。

傳統CV與Deep Learning的區別(圖片來源:Intel簡報)

「要讓AI視覺運算真正快速佈建到應用面,需要一套End to End的解決方案,因此Intel提出了整合軟硬體、從攝影機到雲端的智慧視覺策略與架構。」

這套架構涵蓋了智慧攝影機、邊緣運算(錄影機、伺服器等)、資料中心/雲端平台、用戶端電腦等與影像應用相關的軟硬體系統,可透過Intel提出的FPGA、Movidius等硬體及通用SDK(Unified SDK)來實現智慧視覺的需求。

Intel提出的智慧視覺架構(圖片來源:Intel簡報)

OpenVINO Toolkit

而這場論壇的重頭戲 — OpenVINO ,Intel平台開發經理王宗業表示這是個開放架構、跨平台的AI加速工具,加速了電腦視覺和深度學習的推論(Inference)表現,讓開發者可以專心開發軟體應用相關的功能,更快達成開發上的需求。

OpenVINO提供工具模組(圖片來源:Intel簡報)

講得更清楚,OpenVINO的使用分為模型優化(Model Optimizer)及推論引擎(Inference Engine)兩階段。模型優化可針對已訓練(trained)好的模型再做優化;推論引擎則是高階推論API,可針對CPU、GPU、VPU 或是 FPGA硬體做到效能的最佳化。

另外一個部分,要做影像當然少不了電腦視覺CV,因此, Intel 也將市面上常見的開源軟體 OpenCV,OpenVX 整合進 OpenVINO,而且都是已經 內建最佳化的版本,最重要的是,這部分也可以根據開發者使用的硬體再做最佳化。

透過OpenVINO內建的模組進行最佳化(圖片來源:擷取自王宗業經理簡報)

有關於節點智能的部分,灼灼科技(DT42) 技術長陳伯符(Bofu )說到:「我們公司推出的 BarryNet 就是為了希望能把 Deep Learning 放在 邊緣節點上運行」。

「很多人質疑說 Deep Learning 到底有沒有辦法跑在一般的節點上?」Bofu 提到:「這的確有一定的難度,這也是為什麼我們會推 BarryNet,而我們發現利用 Intel神經計算棒NCS(Movidius Neural Compute Stick)做硬體加速確實是可行的」,目前DT42 已針對 IOT 和 Deep Learning 做出整合開發,提出可行的邊緣運算方案。

Bofu分享結合即時視覺邊緣運算技術與應用(攝影:杜志賢)

「硬體加速需要清楚地瞭解自己的使用場景,才能把錢花在對的地方上。」歐尼克斯實境互動工作室的創辦人 許哲豪(Jack)提到AI視覺系統整合性和執行跨平台時的問題,通常真的是費時又耗財的事情,如今有OpenVINO工具的出現,對於解決這些問題有了不小的幫助。

結論

從生產線產品瑕疵辨識、零售業庫存管理、遠端判斷設備維修需求,到城市與機場的公共安全,這些案例都使用高解析攝影機,產生龐大數據量,並且須加以匯整與分析。而隨著演算法、大數據以及運算能力的提升,加上Caffe、TensorFlow、CNTK、Mxnet等Framework的就緒與開放,讓無所不在的視覺資料有機會被智慧化的運算處理,找出影像背後的價值。

本論壇不僅突顯了視覺應用的廣大需求,也提出了從網路邊緣到雲端的低成本、高效率AI視覺運算架構與工具,希望有助於台灣業者加速AI應用的腳步。

(責任編輯:葉于甄)

Ryan Hu
Hu Ryan

Author: Ryan Hu

對於 IOT 軟硬整合相關有極大興趣,鍾愛無人機,目前獨自完成的專案像是瓦力號、GPS 自動語音導覽系統、NTP 網路自動校時時鐘,喜歡流浪。

Share This Post On

Submit a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *