作者:謝涵如
提起現今科技產業中最炙手可熱的話題,非「人工智慧」莫屬。而在眾多人工智慧的應用當中,「人臉辨識」可說是目前發展最為成熟的一項技術。刷臉支付、門禁管理⋯⋯,諸如此類多元而生活化的「人臉辨識」應用實例,顯示著這項技術早已走入我們的生活當中,為我們帶來生活上的便利。本文將帶領讀者一窺人臉辨識過往發展的脈絡,更全面了解這項正在改變生活的重要技術。
早期發展 — 傳統機器學習算法
利用某一場景下的靜態圖像或者動態序列,到預先儲存的人臉數據庫辨識比對,找出認證場景中,一個或者多個人的身份,此即人臉辨識技術的原理。
早期的人臉辨識,多採用傳統機器學習算法,針對臉部器官的幾何特性,如雙眼間距、頭寬、鼻高,和臉部關鍵特徵點的相對幾何關係,如兩眼角和鼻尖的距離比等,來進行辨識。
但是要精確定位人臉關鍵點相當困難,容易受到表情變化等的影響,導致特徵的不穩定。加上由於提取到的幾何特徵過於簡單,不同人之間的差異性不大,因此此種算法的辨識準確度不高,幾乎無法進行實際應用。
接著,特徵提取方法進入二維人臉表像的階段。此一階段,不再提取具有一定語義資訊的特徵,轉而從圖像中抽取底層物理特徵,如圖像灰度特徵、圖像變換系數、濾波系數、局部紋理描述等。
但表像原始特徵的空間維數很高,不利於訓練和辨識,且大多保留了對辨識不利的噪聲干擾,需要進行進一步的特徵降維,使鑒別資訊得以集中。
傳統機器學習算法發展,在二維圖像上的性能提升始終無法突破,研究者們開始從資訊源的角度改變方向,將人臉辨識從二維靜止圖像,向三維人臉和影像人臉拓展。
突破 — 深度學習算法
2013 年前後,隨著深度學習方法在手寫字符辨識上,展現出超越傳統機器學習算法的性能,加上GPU並行計算的普及,開始有學者研究使用深度學習的人臉辨識算法。
隨即,在LFW人臉資料庫上,深度學習算法突破傳統機器學習算法在二維圖像上的瓶頸,首次將識別率提升到97%以上,引起轟動的同時,也成為日後研究與應用的主流。然而自從進入深度學習的時代以來,各家的人臉辨識算法漸趨於一致,不若傳統機器學習算法時代百家爭鳴。
深度學習應用最普遍的思路就是利用 CNN 網路建立的高維模型,直接從輸入的人臉圖像上,提取有效的鑒別特徵計算餘弦距離,來進行人臉辨識,而大量的數據成為深度學習模型提升性能的主要關鍵。
未來,人臉辨識應有兩大發展方向:一方面從增加人臉數據庫資料量的角度出發,進一步提升模型性能;另一方面則追求在辨識精度不變的情況下,用更小的模型,更快的速度辨識人臉,增進實用價值與應用可能。
小結
在少子化及新冠疫情的推波助瀾下,生活的數位化與智慧化既是趨勢,也是機會。透過檢視人臉辨識過往的發展脈絡,我們能更好地去思考,未來該如何在增進技術層面的同時,更妥善的管理和應用人工智慧,創造出最大利用價值。
(本文經同意轉載自合作媒體 vMaker台灣自造者、原文連結 )
- 3D列印社群自製防疫裝備,共同抗疫 - 2021/07/21
- 保育水資源,我們可以做什麼? - 2021/07/19
- 世界環境日不只是口號,大家能為環境做什麼? - 2021/07/01