作者:Addmaker
智慧型穿戴裝置包含各式傳感器,具備電腦運算能力,能進行數據交換,能提供用戶即時的健康監測、運動追蹤、通知提醒、定位導航、娛樂等,各種應用隨著市場的需求接連出現,今天就來看看日常生活中的「項鍊」和「眼鏡」被附加了哪些特殊的功能!
不用出聲!這條項鍊幫你傳指令給語音助理
智慧型手機快速發展,使用語音助理已經越來越常見了。有事不方便動手滑動時,讓 Siri 幫忙回答個時間,或檢查一下 email 信箱常常已經不假思索,然而總有些時刻並不方便出聲喊,像是在會議室或是安靜的圖書館裡,該怎麼安靜地召喚出語音助理呢?
康乃爾大學電腦與資訊學院的團隊研發出一款設備 SpeeChin,可以藉由頸部與皮膚的紅外線影像變化,來接受無聲的命令。他們研發的這款設備在 2021 年年底於研討會上發表,整體設計像一款項鍊,可以掛在脖子上。
整個設計是基於團隊更早之前就完成的設備 NeckFace 項鍊,可以用來偵測穿戴者的表情。項鍊內建微處理器、電池、藍芽模組,以及一組朝上的紅外線攝影機,對準了穿戴者的下巴肌肉;項鍊的兩邊還有一對「翼」控制攝影機的方向與重心,不會因為穿戴者的移動而偏離太遠;而考慮到隱私權的問題,攝影機的角度避開了使用者的臉。
除了特定的角度與紅外線攝影機,SpeeChin 特別應用的演算法讓整個設備可以在使用者不出聲「默念」的時候將之轉換、傳入指揮智慧型手機。早期的測試中,團隊找來了 20 位志願者,其中 10 位講中文、10 位講英文,參與者被要求使用最常見的命令、數字、標點符號等(54 個英文字、44 個中文字詞)以測試演算法的效力,團隊最終在兩種都獲得了超過 90% 的辨識準確度。
Speechin 如能繼續發展至應用,除了適用於需要保持安靜的環境,也能在某些非常吵雜、會讓麥克風混淆的地方發揮作用;除此之外,對於失去語言能力的人們來說,相關的技術也有機會進一步成為重要的輔助工具。
這款眼鏡看得更細微!用聲波辨識「表情」
隨著穿戴式裝置的演進,有許多團隊開始嘗試不僅進行臉孔辨識,更要能夠完成「表情辨識」的技術。康奈爾大學(Cornell University)研究團隊最近發表了全新的眼球追蹤技術 GazeTrak 和臉部表情讀取技術 EyeEcho,利用聲波而非攝影機來進行辨識,不僅尊重並保護了使用者的隱私,為相關技術應用開啟了全新的可能性。
目前市場上的眼球追蹤與臉部表情讀取技術,多數仍以攝影機為主。這類技術現階段已經可以有很優異的表現,但也存在潛在侵犯使用者隱私以及能量耗費過高的問題,例如,知名的 Tobii Pro Glasses 3,儘管在眼球追蹤上精準度極高,但其電池持續時間卻僅有 1.75 小時。
第一種技術名為 GazeTrak,在每副眼鏡的鏡片框內配置一個小喇叭和四個麥克風(總共兩個小喇叭和八個麥克風)。小喇叭發出聲波,這些聲波會從眼球反射回來,然後被麥克風接收,而由於人類的眼球並非完美的圓形,每一次的回聲到達每個麥克風所需的時間取決於眼球的朝向有所不同,藉由這些毫秒級的差異再利用無線訊號傳到主機以 AI 進行分析,便可以追蹤使用者視線的方向。
第二種技術名為 EyeEcho,與 GazeTrak 相同利用回聲分析,差別在於麥克風和小喇叭的位置是在眼鏡兩個鏡腳鉸鏈旁邊(總共兩個揚聲器和兩個麥克風)。在距離較遠的情況下,可以用聲波偵測臉部皮膚的微妙變化,進一步分析為表情;藉助這項技術,使用者未來可能有機會藉由虛擬的頭像開啟視訊通話,即使在嘈雜的環境中,也不會遭到干擾。
眼球追蹤和臉部表情讀取的技術在未來有著廣泛的應用前景,比如應用於 VR 虛擬空間中,提供更擬真、與視覺角度變化相關的反應,甚至於賦予虛擬頭像即時的反應變化增加互動;在醫療領域上,這兩項技術也助於診斷或監測會影響臉部表情的神經退行性疾病,如阿爾茨海默氏症和帕金森氏症,讓患者在家中就能隨時追蹤疾病的進展。
(本文經同意轉載自 Addmaker 加點製造、原文為 AI 輔助追蹤技術,能以回聲辨識臉部表情、不用出聲!可以看懂你想說什麼的智慧項鍊;責任編輯:賴佩萱)
- 【加點製造】綠色製造:環保 3D 列印與電子回收的創新 - 2024/11/18
- 【加點製造】模組化設計的家具系統,讓空間配置更靈活 - 2024/10/16
- 【加點製造】直逼人類!擁有擬真臉部結構與表情的機器人 - 2024/10/07