【活動報導】解題實務工作坊-AI解題技巧解析

作者:謝涵如

如何在有限的時間內解題,對於參與AIGO解題競賽的團隊是一大挑戰,若能多了解其他人的解題經驗並妥善運用網路資源,其實可以為團隊節省不少心力。

為了讓參賽團隊的解題過程更順利,此次的解題實務工作坊邀請到兩位專業的AI開發者,分享如何利用網路資源做出想要的結果,也帶領學員們體驗AI編碼實作。

「智慧採果辨識」核心 — 物件偵測

專業涉及機電整合、電腦視覺、人機互動、人工智慧、專利分析及新創輔導等各領域的歐尼克斯實境互動工作室創辦人許哲豪,此次介紹主題「智慧採果辨識機器人」,主要功能為利用深度感測器(3D攝影機)鎖定小番茄的位置,配合機器人手臂抓夾採摘。

「定位越準確,抓取成功率越高,因此電腦視覺的訓練是關鍵。」許哲豪表示電腦視覺任務常見的有四種,運算難度由低至高為: 影像分類、物件偵測/定位、語意分割、實例分割,定位小番茄時採取物件偵測技術,也是最常被應用在實務上的一種。

歐尼克斯實境互動工作室創辦人許哲豪,向學員介紹物件偵測技術

物件偵測從1999至2012年以前,都是採取「特徵點提取算法」,僅抓取圖片的特點做辨識。2012年AlexNet推出後,其採取的「深度學習算法」,使辨識率提升10%左右,令人驚豔的成果帶領物件偵測技術進入新時代。

此外,物件偵測技術可分為兩段式與一段式,兩段式較為精準但是速度較慢,一段式則反之。近年最知名的YOLO算法屬於一段式,準確率只有五六成,因此較適合用於辨識錯誤也不會發生危險的情境。

建立完善資料集 辨識更精準

在做物件辨識之前,要先搞懂影像分類及物件辨識的評量方式。影像分類評量是以「真正率/被提取總數」,算出精確率來進行比較。物件偵測的評量方式則更為複雜,除了精確率外,還要將「交集區/連集區」算出聯交比一起比較,聯交比代表偵測的外框是否正確框住物件。

用深度學習算法做物件分類,大致上有四個步驟:取像後精準的將物件框出做標註,放到模型裡進行大量運算訓練,最後得到推論。在取像時,要確保品質近似,並且以多視點、多光源差異、多背景、品種等,建立有足夠多樣性的資料集。無法取得足夠資料時,也可以藉由如翻轉、縮放、調整色彩等方式進行資料擴增。

此外,還可以善用如Pascal VOC、Image Net、MS COCO等網路上的物件偵測資料集來補足,不過同時必須注意資料是否已被標註過,以及標註的方式是否是自己所需要的。

善用開源程式解題 與時間賽跑

擅長資料爬蟲、資料視覺化、數據分析與影像辨識的開源智造 AI Scientist蕭聖哲,曾在第一梯次的解題競賽中以「AI髮絲去背技術開發」獲獎。蕭聖哲回憶,由於當時準備時間僅有三個月,因此他們沒有選擇從零開始自行訓練模型,而是藉助網路資源,採用他人已經訓練好的模型進行拼湊組合。

曾經參賽並獲獎的開源智造 AI Scientist蕭聖哲,分享如何利用開源程式碼順利解題

提出題目的客戶希望能節省幫圖片,特別是髮絲部分去背的時間,並提出團隊可以參考MIT所發表的「Sematic Soft Segmentation」(簡稱SSS)文章。但是當團隊實際操作SSS系統時,發現了許多問題。首先,SSS去背時,是先用群聚分析(K-means)將圖片分為五個圖層,去背後目標物位於哪個圖層是隨機的,因此每次產生結果不同。再來有時目標物會被拆成多個物件,並且運算時間過長,效率低。此外,它同時使用了Python與Matlab兩個程式碼,使用上有些不便。

目前的去背方法有兩種,Segmentation將每個像素的語意進行理解並分類得到去背結果,但是標的物的邊緣切割效果會較為粗糙。Matting則是藉由找出前景與背景的顏色,及它們之間的融合程度,邊緣分割效果自然,然而必須耗費人工繪製黑白灰三色分層的「trimap」圖。

團隊比較了各種Segmentation與Matting程式後,選擇了效果最好的 DeepLab V3+與Deep Matting並將兩者結合。首先先利用DeepLab V3+產生一個遮罩圖,選擇「Automatic Trimap Generator」開源程式碼將外圍頭髮區域框上灰色,再用Deep Matting針對灰色區域做更細緻的處理,最後順利開發出能細緻處理髮絲去背的「Auto Hair」解題成功。

小結

AI的技術日益精進,愈來愈多企業/產業想導入AI來解決自己的痛點,而掌握技術的AI團隊即扮演了重要的落地解題要角。然而,各方的需求千奇百怪,解題團隊與其從無到有的開發,更可掌握「前輩」的經驗,加快解題的速度。透過此次的工作坊經驗分享,大家都學到解題設定(提案思路)、AI技術方法與系統架構的規劃的要領,並體驗實作程式碼的編寫技巧,可謂滿載而歸。

講師與學員大合照

(責任編輯:歐敏銓)

Author: 謝涵如

喜歡窩在自己的一方世界裡寫作閱讀,也喜歡四處旅遊找驚喜,希望能多接觸學習各種知識,從中拼湊出世界的全貌。

Share This Post On

發表

跳至工具列