|

【AI_Column】影像式AI虛擬助理真的要來了嗎?(下)

   

作者:許哲豪 Jack

上一篇從影像式AI虛擬助理的應用場景以及關鍵技術進行討論,本文則著重在於市場趨勢發展,在目前市場發展的趨勢下,「語音助理」已經看似走到了瓶頸,而影像式AI虛擬助理是否能為「語音助理」帶來一道新的氣象?

從2D到3D的AI虛擬助理

2011年Apple Siri上市後,許多廠商就把較單純客服性質的對話服務移轉到具有聊天機器人的2D虛擬分身(Virtual Avatar)或稱虛擬助理(Virtual Assistant)、虛擬代理人(Virtual Agent)的系統上,但螢幕上虛擬人物最多只能點點頭、微笑說話,並不能有太多互動,且對話內容僅限服務項目。

後來許多網路攝影機(Webcam)廠商也陸續推出簡易型虛擬分身,讓使用者在網路上和其它人交流時可以不必顯示真面目,而以虛擬代理人顯示,此時的技術已可做到簡單的人臉位置追蹤及聲音驅動嘴形開合(嘴形和發音無關)。

近年來隨著人工智慧及智慧音箱技術的突飛猛進,因此影像式AI虛擬助理也隨之興起另一波風潮。以下就簡單盤點一下目前已發佈消息及已上市產品,包括日本Vinclu的Gatebox、韓國SK Telecom的HoloBox、美國DoubleMe的HoloTube、HoloDash及Samsung的Project Aurora。

日本動漫新寵兒 — Gatebox

首先,介紹日本的GateBox,2016年推出網路集資版本(下圖A),限量發行300台,主要特色就是把虛擬助理具像化,變成宅男們最愛的動漫偶像,她不只像管家般協助行程預約、家電控制,還能陪你聊天,更能為你唱歌跳舞,有如宅男們一個專屬的演唱會。

其中運用到全息膜微投影技術,人物如同浮空投影,虛實混合,真實感極佳。另外機器同時有攝影機、麥克風及感測器可偵用者位置追蹤、表情分析、手勢互動及語音控制等,藉此令虛擬助理產生對應動作、表情等。如果使用者出門時,還能用手機上的APP提供相關服務,讓宅男們一分鐘也不想離開。所以雖然預購單價高達三十萬日元,一推出還是被一掃而空。

2017年底交貨時和原先外觀有很大不同(下圖B),看起來有點像咖啡機,但功能大致和原先提案接近。2018年獲得LINE大力注資,企圖把市場擴大至下一代影像式虛擬助理,GateBox隨即推出第三代產品(下圖C),並將原先的APP改成LINE,未來將和語音助理Clova合作。

更重要的是目前已把售價一口氣降到一半,只剩十五萬日元,期望使用者能更容易接受並加速市場佔有率。

GateBox演進:(A)第一代2016;(B)第二代2017;(C)第三代2018(圖片來源:https://gatebox.ai/

韓國偶像 — Wendy

接著介紹今(2018)年WMC上出現的二台概念機。首先介紹由韓國電信商SK Telecom 和技術團隊Reality Reflections共同打造的HoloBox和接近真人的虛擬(偶像)助理Wendy (如下圖)。他們主打的功能除了一般語音助理功能外,虛擬(偶像)助理還可以提供一百多種表情,並可辨識常用手勢用於控制系統。

其中的虛擬(偶像)助理是經由多達一百六十多台攝影機拍攝及數週時間的處理才得以產生的。顯示時採用一般LCD顯示幕,搭配深色圓柱形玻璃(或壓克力)來避免看到非顯示內容的區域。另外系統還可把虛擬(偶像)助理也同步到手機上,方便使用者隨處可用。

SK Telecom推出的HoloBox和接近真人的虛擬(偶像)助理Wendy (圖片來源:https://goo.gl/EeHCgB

美英韓聯手出擊 — DoubleMe的HoloTube和HoloDash

另一台概念機則是由美英韓組成的團隊DoubleMe推出的MxR Tube (HoloTube)。他們主要技術是用多攝影機快速360度掃描人的動作(如跳舞、踢球等)並建立動態3D模型。為了顯示動態3D模型,DoubleMe直接採用一片直立式LCD顯示器,加上一個紅外線手勢偵測模組,方便使用者直接操作(旋轉模型角度)改變觀賞視點,非常適合用於記錄如運動、結婚、表演等情境。今(2018)年8月時又推出新一代產品(HoloDash),外觀上很像膠囊,一樣是用手勢辨識方式來操控顯示內容。

Samsung — Project Aurora

今年三月在SXSW 2018上,Samsung也推出一款影像式虛擬助理,稱為「Project Aurora」。其概念就像Google Cardboard VR眼鏡,系統本身只有一塊斜放45度的半透鏡,並沒有電子系統,有別於上述都是整機的概念。使用者只要啟動手機上的執行應用程式(APP)再插入機器中,經過半透鏡反射後,使用者就可看到非常可愛的卡通公仔(虛擬助理)在對你招手,且可同時還看到背後的真實世界影像。

另外機器上方有一個反射鏡,讓平躺的手機也能利用其攝像頭拍到使用者的臉。操作上原則上和一般語音助理無異,只是多了更多視覺上的效果及趣味。

Samsung Project Aurora:(A)右後側視圖,(B)顯示內容,(C)半仰視圖

結論

目前語音助理主要功能為線上查詢採購、家電控制、影音播放及社交聊天等,隨著電子技術、智慧物聯網(IoT)週邊、雲端語音辨識及影像識別能力突飛猛進,這項產品已成為當前市場主打產品。

為了能更滿足使用者的視覺效果及更直接地溝通,我們可以大膽地預言下一世代一定是朝向影像式虛擬(偶像)助理方向前進,從上述介紹的關鍵技術及多個概念性的產品進展來看,相信科幻電影中的情境不久後就有機會實現了。

(本文同步發表於歐尼克斯實境互動工作室原文連結;責任編輯:葉于甄)

許 哲豪

Author: 許 哲豪

工作經驗超過二十年,主要專長機電整合、電腦視覺、人機互動、人工智慧、專利分析及新創輔導。曾任機電整合工程師、機器視覺研發副理、技轉中心商業發展經理。目前擔任多家公司兼任技術顧問並積極推廣實境互動相關技術。 主持歐尼克斯實境互動工作室(OmniXRI):http://omnixri.blogspot.com Edge AI Taiwan邊緣智能交流區:https://www.facebook.com/groups/edgeaitw/

Share This Post On

Submit a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *