|

【介面革命】AI語音助手,讓智慧家庭更人性!

   

作者:沈信甫

Echo在智慧家庭扮演重要的角色

你心中是否還在疑惑:AI語音助手全民化的時代真的來臨了嗎?Make2Real共同創辦人Jason Ho表示:在AmazonGoogleMicrosoft等國際大廠近年來相繼投入開發及研究後,已陸續推出讓消費者有感的產品,語音介面進入一般人生活的腳步已經開始加速。

圖為Echo Skill最受消費者歡迎的前五名APP之一 :Restaurants

從使用者角度來設計服務

隨著Amazon Echo的熱賣,近來吹起聲控風,Jason Ho對此特別提到:「如果想進場佔大餅,不能只專注在技術研發上,也要找出受眾有可能使用語音助手的情境,不然可能面臨到即使做出產品,卻不被消費者接受的狀況。」

根據分析機構的調查數據,有98%的群眾會嘗試使用語音助手,但卻有將近70%的人並不常繼續使用其服務。以Siri為例,其內建的智慧語音功能相當齊備,為何許多人卻不願意持續使用它呢?癥結點就是人在使用語音助手時的心理反應。

多數使用者較少在公眾場合上開啟語音助手的原因,在於人們其實不太喜歡讓陌生人聽到其與語音助手對話的內容,因為其中涵蓋個人的隱私資訊,這也導致戶外性的服務始終不太容易發展起來,直到以提供居家服務為主的Ehco現世,成功的避開人們心中的敏感地帶,更把服務融入日常生活中,才徹底翻轉使用者對它的想像。

Alexa與使用者互動的方式與流程

開發者共創平台是關鍵

Amzon Echo為例,在這裝置的背後有一套服務平台在支撐著,主要分成兩大塊互補的開發環境,分別是AVS (Amazon Voice Service) ASK (Amazon Skills Kit),前者強調的是語音的分析及語意的理解,當使用者透過語音向local端下達指令時,裝置會先把語音錄下來,並透過VTTVoice to Text)將語音轉成文字檔上傳到至雲端,再透過數據庫進行比較、辨別其中的內容,並回覆語音內容,或對應到適合的後端APP

後者則是Echo受消費者歡迎的重點所在,因為Skill正是它的外部應用程式,讓它不單侷限於資訊查詢功能,更能藉由物聯網讓裝置與家電串連起來,進而能即時控制家中各處的電器。為了打造Skill的開發者生態圈,Amazon建立了共創平台,並投入高達100萬美金,鼓勵中小企業及Maker去開發延伸的Skill應用。

AVS vs. ASK架構圖

Jason說到,回顧語音助手產品的發展,從Push-to-Talk,到Tap-to-Talk,一直演進到喚醒詞(wake word)的出現,才正式開啟語音助手的新面貌。喚醒詞的用意是,當說出預設的指令時,語音助手才會對後續的對話產生反應。

事實上,光要讓機器聽得懂人在說什麼,就存在相當高的門檻,但這也就是第三方的演算法公司存在的價值。Jason Ho指出:「要寫出人性化的演算法並不容易,需有大量的資源及時間去建立Data base。」

挑戰與機會

雖然語音、語意的研發門檻極高,但隨著大廠釋出了Open API,讓Maker也有了揮灑的空間,可以用Rapsberry Pi或其他平台來玩出自己的聲控創意。在演講的結尾,Jason Ho也推薦兩部影集,看完能夠更了解AI人工智能可到達的程度,分別是《真實的人類 》以及《西方極樂園》。

影集《真實的人類》劇照

結語

人與機器間的界線已漸漸地消逝,人工智能也不再只侷限在查詢資訊,更能滲透進群眾平時的生活中,成為解決日常問題的好幫手;若是決定要進入語音助手領域的Maker,不能單把目光放在技術的層面上,更要學習洞察出使用者的需要,提供差異化服務。

OLYMPUS DIGITAL CAMERA

(本文整理自《智慧空調創新自造松》充電課Jason Ho的演講,主題是「語音人機應用介面介紹:以echo為例」。)

Author:

Share This Post On

2 Comments

  1. 語音是錄下後上傳至 AVS, 並不是先做 voice to text. 這部份 alexa網站有清楚說明。
    Wake up word 現在也有 cloud 版

    Post a Reply
    • 賴芳如

      您好,我們是MakerPRO編輯部,謝謝您提供的資訊噢!不過可能是文句說明不夠清楚,這部分待我們向講者確認後再調整文章內容,非常謝謝您!

      Post a Reply

Submit a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *