【AI入門】人臉辨識技術發展回顧

作者:謝涵如

提起現今科技產業中最炙手可熱的話題,非「人工智慧」莫屬。而在眾多人工智慧的應用當中,「人臉辨識」可說是目前發展最為成熟的一項技術。刷臉支付、門禁管理⋯⋯,諸如此類多元而生活化的「人臉辨識」應用實例,顯示著這項技術早已走入我們的生活當中,為我們帶來生活上的便利。本文將帶領讀者一窺人臉辨識過往發展的脈絡,更全面了解這項正在改變生活的重要技術。

早期發展 — 傳統機器學習算法

利用某一場景下的靜態圖像或者動態序列,到預先儲存的人臉數據庫辨識比對,找出認證場景中,一個或者多個人的身份,此即人臉辨識技術的原理。

早期的人臉辨識,多採用傳統機器學習算法,針對臉部器官的幾何特性,如雙眼間距、頭寬、鼻高,和臉部關鍵特徵點的相對幾何關係,如兩眼角和鼻尖的距離比等,來進行辨識。

但是要精確定位人臉關鍵點相當困難,容易受到表情變化等的影響,導致特徵的不穩定。加上由於提取到的幾何特徵過於簡單,不同人之間的差異性不大,因此此種算法的辨識準確度不高,幾乎無法進行實際應用。

接著,特徵提取方法進入二維人臉表像的階段。此一階段,不再提取具有一定語義資訊的特徵,轉而從圖像中抽取底層物理特徵,如圖像灰度特徵、圖像變換系數、濾波系數、局部紋理描述等。

但表像原始特徵的空間維數很高,不利於訓練和辨識,且大多保留了對辨識不利的噪聲干擾,需要進行進一步的特徵降維,使鑒別資訊得以集中。

傳統機器學習算法發展,在二維圖像上的性能提升始終無法突破,研究者們開始從資訊源的角度改變方向,將人臉辨識從二維靜止圖像,向三維人臉和影像人臉拓展。

以人臉表象特徵進行辨識是傳統機器學習算法的一種辨識方法。(圖片來源:一文看懂人臉辨識技術發展脈絡

突破 — 深度學習算法

2013 年前後,隨著深度學習方法在手寫字符辨識上,展現出超越傳統機器學習算法的性能,加上GPU並行計算的普及,開始有學者研究使用深度學習的人臉辨識算法。

隨即,在LFW人臉資料庫上,深度學習算法突破傳統機器學習算法在二維圖像上的瓶頸,首次將識別率提升到97%以上,引起轟動的同時,也成為日後研究與應用的主流。然而自從進入深度學習的時代以來,各家的人臉辨識算法漸趨於一致,不若傳統機器學習算法時代百家爭鳴。

深度學習應用最普遍的思路就是利用 CNN 網路建立的高維模型,直接從輸入的人臉圖像上,提取有效的鑒別特徵計算餘弦距離,來進行人臉辨識,而大量的數據成為深度學習模型提升性能的主要關鍵。

未來,人臉辨識應有兩大發展方向:一方面從增加人臉數據庫資料量的角度出發,進一步提升模型性能;另一方面則追求在辨識精度不變的情況下,用更小的模型,更快的速度辨識人臉,增進實用價值與應用可能。

2013 年前後,人臉辨識進入深度學習的時代(圖片來源:人工智慧、機器學習和深度學習哪裡不一樣?

小結

在少子化及新冠疫情的推波助瀾下,生活的數位化與智慧化既是趨勢,也是機會。透過檢視人臉辨識過往的發展脈絡,我們能更好地去思考,未來該如何在增進技術層面的同時,更妥善的管理和應用人工智慧,創造出最大利用價值。

(本文經同意轉載自合作媒體 vMaker台灣自造者原文連結 )

Author: vMaker編輯部

vMaker粉專每天網羅新奇有趣的科技新知、生活手作內容,並提供創客原創文章及活動資訊。 按讚粉專獲得更多科技新鮮事👉https://lihi1.cc/ezQcE

Share This Post On

發表