作者:楊子嫻
第二場 AIGO 社群交流會,邀請到了微軟技術傳教士 Yvonne Shih 來分享電腦視覺的最新技術與趨勢,以及歐尼克斯實境互動工作室創辦人 Jack Hsu 談談 OpenCV 與深度學習相關模組。
由經濟部工業局發起的 AIGO 計畫,除了有「產業出題 x 人才解題與「課程培訓」之外,更希望透過線上線下活動來凝聚台灣 AI 人才社群,因此有了《 AIGO 社群交流會》系列,藉由邀請 AI 社群代表分享經驗與知識,讓 AI 圈的同好能齊聚一堂、彼此認識交流。
電腦視覺最新技術趨勢分享
第一場談了智慧醫療,5/21第二場的主軸放在電腦視覺發展,首先由該領域的專家,微軟技術傳教士 Yvonne Shih 來分享,目前微軟 Azure 所提供的服務,可讓有興趣民眾自行操作、體驗看看。她指出在 Computer Vision 服務的部分,一共可以分成三大類,分別是深入分析影像、擷取影像中的文字以及調節影像中的內容。
而微軟提供的服務種類繁多,包括了標記影像、偵測文件、品牌偵測、影像分類、影像描述範例、偵測臉部等等。例如首先提到的 Video Indexer ,能夠解析影片中有哪些談話者以及精采片段,透過深度學習分析與解析出影片的精華重點部分。
Yvonne 同時也操作了幾樣微軟提供的應用程式,並邀請現場聽眾上台測試,例如可以辨識自己與哪個藝人長得相像的 Celebrity Match;可以偵測分析使用者在什麼情況下屬於高危險駕駛的 Realtime Driver Monitoring。最後,針對有聽眾提出的雲端問題,例如容量過大、沒有網路等等, Yvonne 指出解決方案為具備Edge AI的智能攝影機,先將數據存入裝置內,就能在不連網的狀況下直接偵測分析畫面。
OpenCV 與深度學習應用
緊接著 Yvonne 之後,是歐尼克斯工作室的創辦人 Jack ,開頭先幫大家簡介了 OpenCV 以及深度學習的相關模組。 OpenCV 是目前最多人使用的開源影像辨識程式庫,可在各種硬體、平台及程式語言上執行,內容包含基本影像處理、特徵提取、物件辨識、立體視覺、機器學習。而 OpenCV 的使用方式也相當簡化,只要載入模型與影像,讓其進行推論, Jack 更打趣地說,不需要知道推論過程中發生了什麼事,總之最後能得出結果就行。
介紹完了概念, Jack 也分享了 OpenCV 深度學習的實際應用,像是影像分類、物件偵測、影像著色、人臉辨識等等。影像分類與物件偵測類似,不同之處在於,影像分類只能輸出一種結果,因此只能應用在影像中只有一個主物體時,而物件偵測則可以輸出多種結果。
其中較有趣的應用,應屬影像著色,這項技術可被用在修復老照片上,雖然無法百分之百準確,但已能將黑白照片還原成相近原色的彩色照片。人臉辨識是 OpenCV 最厲害的部分,過去使用積分影像,優點是分析速度快然而準確率低,現在使用深度學習則是大幅提升了準確率,但計算量大而使速度變慢, Jack 指出現在較多的作法是兩者混和,先使用積分影像找出大概位置,再放到較正確的深度學習中辨識。
小結
每場交流會除了傳遞新知、分享資訊外,最難能可貴的是一群同好的聚集,在一問一答之中,除了替自己解惑,更是一步一步推著台灣的 AI 產業前進。此次兩位講者的分享,不只看到未來電腦視覺發展趨勢,學習相關知識外,也讓人可以實際操作參與其中,體驗最新科技。
- 【活動報導】Dr. AI實現遠距照護,智慧醫療再進化 - 2019/09/27
- 【RealSense社聚#1】3D感測遇上AI電腦視覺再進化 - 2019/09/26
- 【自造創業】作品變商品,圓一個硬體創業夢的背後現實 - 2019/08/06