|

【活動報導】AI X 視覺:OpenCV 深度學習影像新領域

   

作者:楊子嫻

第二場 AIGO 社群交流會,邀請到了微軟技術傳教士 Yvonne Shih 來分享電腦視覺的最新技術與趨勢,以及歐尼克斯實境互動工作室創辦人 Jack Hsu 談談 OpenCV 與深度學習相關模組。

由經濟部工業局發起的 AIGO 計畫,除了有「產業出題 x 人才解題與「課程培訓」之外,更希望透過線上線下活動來凝聚台灣 AI 人才社群,因此有了《 AIGO 社群交流會》系列,藉由邀請 AI 社群代表分享經驗與知識,讓 AI 圈的同好能齊聚一堂、彼此認識交流。

電腦視覺最新技術趨勢分享

第一場談了智慧醫療5/21第二場的主軸放在電腦視覺發展,首先由該領域的專家,微軟技術傳教士 Yvonne Shih 來分享,目前微軟 Azure 所提供的服務,可讓有興趣民眾自行操作、體驗看看。她指出在 Computer Vision 服務的部分,一共可以分成三大類,分別是深入分析影像、擷取影像中的文字以及調節影像中的內容。

而微軟提供的服務種類繁多,包括了標記影像、偵測文件、品牌偵測、影像分類、影像描述範例、偵測臉部等等。例如首先提到的 Video Indexer ,能夠解析影片中有哪些談話者以及精采片段,透過深度學習分析與解析出影片的精華重點部分。

Yvonne 同時也操作了幾樣微軟提供的應用程式,並邀請現場聽眾上台測試,例如可以辨識自己與哪個藝人長得相像的 Celebrity Match;可以偵測分析使用者在什麼情況下屬於高危險駕駛的 Realtime Driver Monitoring。最後,針對有聽眾提出的雲端問題,例如容量過大、沒有網路等等, Yvonne 指出解決方案為具備Edge AI的智能攝影機,先將數據存入裝置內,就能在不連網的狀況下直接偵測分析畫面。

Yvonne 邀請聽眾現場操作人臉辨識軟體(攝影:張祐瑄)

OpenCV 與深度學習應用

緊接著 Yvonne 之後,是歐尼克斯工作室的創辦人 Jack ,開頭先幫大家簡介了 OpenCV 以及深度學習的相關模組。 OpenCV 是目前最多人使用的開源影像辨識程式庫,可在各種硬體、平台及程式語言上執行,內容包含基本影像處理、特徵提取、物件辨識、立體視覺、機器學習。而 OpenCV 的使用方式也相當簡化,只要載入模型與影像,讓其進行推論, Jack 更打趣地說,不需要知道推論過程中發生了什麼事,總之最後能得出結果就行。

介紹完了概念, Jack 也分享了 OpenCV 深度學習的實際應用,像是影像分類、物件偵測、影像著色、人臉辨識等等。影像分類與物件偵測類似,不同之處在於,影像分類只能輸出一種結果,因此只能應用在影像中只有一個主物體時,而物件偵測則可以輸出多種結果。

其中較有趣的應用,應屬影像著色,這項技術可被用在修復老照片上,雖然無法百分之百準確,但已能將黑白照片還原成相近原色的彩色照片。人臉辨識是 OpenCV 最厲害的部分,過去使用積分影像,優點是分析速度快然而準確率低,現在使用深度學習則是大幅提升了準確率,但計算量大而使速度變慢, Jack 指出現在較多的作法是兩者混和,先使用積分影像找出大概位置,再放到較正確的深度學習中辨識。

Jack 將 OpenCV 講解的相當透徹(攝影:俞采寧)

小結

每場交流會除了傳遞新知、分享資訊外,最難能可貴的是一群同好的聚集,在一問一答之中,除了替自己解惑,更是一步一步推著台灣的 AI 產業前進。此次兩位講者的分享,不只看到未來電腦視覺發展趨勢,學習相關知識外,也讓人可以實際操作參與其中,體驗最新科技。

楊 子嫻
楊 子嫻

Author: 楊 子嫻

意外踏入Maker世界的文科生 希望能靠筆桿生活的菜鳥編輯 正在努力摸索探索這個新領域 堅信文字的溫度能夠感動人心

Share This Post On

Submit a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *