【活動報導】AI X 視覺：OpenCV 深度學習影像新領域

Posted By 楊子嫻 on 5 月 28, 2019 in AIGO, Edge AI開發地圖, 活動報導 | 0 comments

作者：楊子嫻

第二場 AIGO 社群交流會，邀請到了微軟技術傳教士 Yvonne Shih 來分享電腦視覺的最新技術與趨勢，以及歐尼克斯實境互動工作室創辦人 Jack Hsu 談談 OpenCV 與深度學習相關模組。

由經濟部工業局發起的 AIGO 計畫，除了有「產業出題 x 人才解題與「課程培訓」之外，更希望透過線上線下活動來凝聚台灣 AI 人才社群，因此有了《 AIGO 社群交流會》系列，藉由邀請 AI 社群代表分享經驗與知識，讓 AI 圈的同好能齊聚一堂、彼此認識交流。

電腦視覺最新技術趨勢分享

第一場談了智慧醫療，5/21第二場的主軸放在電腦視覺發展，首先由該領域的專家，微軟技術傳教士 Yvonne Shih 來分享，目前微軟 Azure 所提供的服務，可讓有興趣民眾自行操作、體驗看看。她指出在 Computer Vision 服務的部分，一共可以分成三大類，分別是深入分析影像、擷取影像中的文字以及調節影像中的內容。

而微軟提供的服務種類繁多，包括了標記影像、偵測文件、品牌偵測、影像分類、影像描述範例、偵測臉部等等。例如首先提到的 Video Indexer ，能夠解析影片中有哪些談話者以及精采片段，透過深度學習分析與解析出影片的精華重點部分。

Yvonne 同時也操作了幾樣微軟提供的應用程式，並邀請現場聽眾上台測試，例如可以辨識自己與哪個藝人長得相像的 Celebrity Match；可以偵測分析使用者在什麼情況下屬於高危險駕駛的 Realtime Driver Monitoring。最後，針對有聽眾提出的雲端問題，例如容量過大、沒有網路等等， Yvonne 指出解決方案為具備Edge AI的智能攝影機，先將數據存入裝置內，就能在不連網的狀況下直接偵測分析畫面。

Yvonne 邀請聽眾現場操作人臉辨識軟體（攝影：張祐瑄）

OpenCV 與深度學習應用

緊接著 Yvonne 之後，是歐尼克斯工作室的創辦人 Jack ，開頭先幫大家簡介了 OpenCV 以及深度學習的相關模組。 OpenCV 是目前最多人使用的開源影像辨識程式庫，可在各種硬體、平台及程式語言上執行，內容包含基本影像處理、特徵提取、物件辨識、立體視覺、機器學習。而 OpenCV 的使用方式也相當簡化，只要載入模型與影像，讓其進行推論， Jack 更打趣地說，不需要知道推論過程中發生了什麼事，總之最後能得出結果就行。

介紹完了概念， Jack 也分享了 OpenCV 深度學習的實際應用，像是影像分類、物件偵測、影像著色、人臉辨識等等。影像分類與物件偵測類似，不同之處在於，影像分類只能輸出一種結果，因此只能應用在影像中只有一個主物體時，而物件偵測則可以輸出多種結果。

其中較有趣的應用，應屬影像著色，這項技術可被用在修復老照片上，雖然無法百分之百準確，但已能將黑白照片還原成相近原色的彩色照片。人臉辨識是 OpenCV 最厲害的部分，過去使用積分影像，優點是分析速度快然而準確率低，現在使用深度學習則是大幅提升了準確率，但計算量大而使速度變慢， Jack 指出現在較多的作法是兩者混和，先使用積分影像找出大概位置，再放到較正確的深度學習中辨識。