【視覺進化論】AI智慧視覺運算技術論壇 — OpenVINO面面觀

Posted By Ryan Hu on 10 月 23, 2018 in Intel, OpenVINO, Sertek, 活動報導, 觀點, 開發套件 | 0 comments

作者：Ryan Hu

這場技術論壇主要探討如何以低成本建構視覺解決方案，來建構從網路邊緣到雲端的視訊分析與深度學習，進而獲取有價值的商業情資，並讓智慧視覺的技術帶來更多創新應用與商機。

最近全球興起AI熱潮，在業界的應用中，視覺的智慧應用無疑是快速成長的一個領域，涵蓋了民生、工業、建築、交通等各個層面。然而，很多業者想引進AI視覺應用，都卡在投入的時間與成本太高，因而卻步，為此Sertek特別舉辦了這場《AI智慧視覺運算技術論壇》，邀集了多位專家共聚一堂，一同探討如何以低成本建構視覺解決方案，來建構從網路邊緣到雲端的視訊分析與深度學習，進而獲取有價值的商業情資，並讓智慧視覺的技術帶來更多創新應用與商機。

勢在必行的邊緣運算

論壇一開始，Intel資深亞洲區物聯網業務開發經理桑和崇指出邊緣運算正在崛起，並以中國的「天網」作為例子：目前中國在天網的架構下實際佈建的攝影機數目已經到達 1 億 7000 多萬支，在 2020 年預計會增加到 4 億隻，若是影像全部都上雲端，頻寬必定是個大問題。因此他強調「網路勢必要變得更強大，每個節點都將有運算的能力以及智能」，這也突顯了邊緣運算未來發展的重要性。

桑經理提到：「當80% 的網路流量都來自影像時，如何有效處理這些影像的資料是個值得探討的問題。」畢竟實際有用的影像資料有限，若全數上傳雲端實在浪費頻寬。換句話說，在網路邊緣必須過濾出有效的資料，增加節點智能勢在必行。

桑和崇經理強調邊緣運算在影像辨識中的重要性（攝影：杜志賢）

接續邊緣運算探討後，主線來到電腦視覺（Computer Vision, CV）和深度學習（Deep Learning, DL）的比較，過去是用傳統的 CV來處理影像，在判斷精準上遠遠不及 Deep learning 的效果，桑崇和簡單用在跳舞的舞者的一張照片為例，CV 辨識的是鳥，而 DL 卻能辨識出人眼看到的舞者樣貌。

傳統CV與Deep Learning的區別（圖片來源：Intel簡報）

「要讓AI視覺運算真正快速佈建到應用面，需要一套End to End的解決方案，因此Intel提出了整合軟硬體、從攝影機到雲端的智慧視覺策略與架構。」

這套架構涵蓋了智慧攝影機、邊緣運算（錄影機、伺服器等）、資料中心/雲端平台、用戶端電腦等與影像應用相關的軟硬體系統，可透過Intel提出的FPGA、Movidius等硬體及通用SDK（Unified SDK）來實現智慧視覺的需求。

Intel提出的智慧視覺架構（圖片來源：Intel簡報）

OpenVINO Toolkit

而這場論壇的重頭戲 — OpenVINO ，Intel平台開發經理王宗業表示這是個開放架構、跨平台的AI加速工具，加速了電腦視覺和深度學習的推論（Inference）表現，讓開發者可以專心開發軟體應用相關的功能，更快達成開發上的需求。

OpenVINO提供工具模組（圖片來源：Intel簡報）

講得更清楚，OpenVINO的使用分為模型優化（Model Optimizer）及推論引擎（Inference Engine）兩階段。模型優化可針對已訓練（trained）好的模型再做優化；推論引擎則是高階推論API，可針對CPU、GPU、VPU 或是 FPGA硬體做到效能的最佳化。

另外一個部分，要做影像當然少不了電腦視覺CV，因此， Intel 也將市面上常見的開源軟體 OpenCV，OpenVX 整合進 OpenVINO，而且都是已經內建最佳化的版本，最重要的是，這部分也可以根據開發者使用的硬體再做最佳化。

透過OpenVINO內建的模組進行最佳化（圖片來源：擷取自王宗業經理簡報）

有關於節點智能的部分，灼灼科技（DT42）技術長陳伯符（Bofu ）說到：「我們公司推出的 BarryNet 就是為了希望能把 Deep Learning 放在邊緣節點上運行」。

「很多人質疑說 Deep Learning 到底有沒有辦法跑在一般的節點上？」Bofu 提到：「這的確有一定的難度，這也是為什麼我們會推 BarryNet，而我們發現利用 Intel神經計算棒NCS（Movidius Neural Compute Stick）做硬體加速確實是可行的」，目前DT42 已針對 IOT 和 Deep Learning 做出整合開發，提出可行的邊緣運算方案。

Bofu分享結合即時視覺邊緣運算技術與應用（攝影：杜志賢）

「硬體加速需要清楚地瞭解自己的使用場景，才能把錢花在對的地方上。」歐尼克斯實境互動工作室的創辦人許哲豪（Jack）提到AI視覺系統整合性和執行跨平台時的問題，通常真的是費時又耗財的事情，如今有OpenVINO工具的出現，對於解決這些問題有了不小的幫助。

結論

從生產線產品瑕疵辨識、零售業庫存管理、遠端判斷設備維修需求，到城市與機場的公共安全，這些案例都使用高解析攝影機，產生龐大數據量，並且須加以匯整與分析。而隨著演算法、大數據以及運算能力的提升，加上Caffe、TensorFlow、CNTK、Mxnet等Framework的就緒與開放，讓無所不在的視覺資料有機會被智慧化的運算處理，找出影像背後的價值。

本論壇不僅突顯了視覺應用的廣大需求，也提出了從網路邊緣到雲端的低成本、高效率AI視覺運算架構與工具，希望有助於台灣業者加速AI應用的腳步。

（責任編輯：葉于甄）