|

【活動報導】Maker玩聲控,正是時候!

   

作者:小波

聲控當紅,Maker該如何玩出自己的聲控應用呢?現任众社會企業資訊長的邱鴻鈞(Lanma),從軟體專業投入這領域已有一段時間,從Amazon Echo、Google Home、Google紙箱版Voice Kit到華碩 Zenbo 機器人,以及Chatbot的架構與技術等,都深入研究過。這次特別邀請他為大家深入淺出地介紹他親測過的三種品牌在體驗上的表現,以及Maker該如何入門這個最自然的人機介面領域。

Lanma 用一張圖完整呈現了語音助理系統運作的綜觀架構(資料來源/Lanma)

1. 智慧居家好夥伴 – ASUS Zenbo

Lanma 跟 Zenbo 互動,以聲控的形式打開了警報。

開場 Demo 時,Zenbo 不只跟大家對話、互動,還自己跳舞,真的相當可愛!接著 Lanma 更示範了「鸚鵡講話 、 猜猜我幾歲、和朋友說話、開啟與關閉警報」等有趣的語音功能。

這一個甫奪下德國紅點產品設計大獎的 Zenbo ,是本次介紹的產品中唯一能自己移動又具有螢幕介面的產品,主打親子幼教,搭配可定向麥克風,因此在呼叫 Zenbo 時,他會尋找並面對你,雖然當場測試時似乎不那麼靈敏,但 Lanma 細心地解說讓大家明白 Zenbo 獨到之處。

值得一提的是,雖然其 3D 相機成本就高達六萬多塊,但事實證明 3D 相機讀取景深的功能,在做影像追蹤的時候相當有幫助;另外, Zenbo 使用的是 Andorid 系統,在操作上更貼近我們常用的智慧型手機,有原生 SDK 、故事編輯器、圖形化編輯器、對話編輯器,再加上語音對話與控制的服務,也開放API給開發者,Maker想玩出創意其實不難 - 只要跨越價格門檻!

2. 蓄勢待發的 Google Home

Google Home 可以透過 Google Assistant SDK ,連接 Raspberry Pi 3 和 USB 麥克風使用。

Google Home 於2016年所推出,內建智慧家庭系統 Google Assistant ,除了具備翻譯、導航、送簡訊、播放音樂功能,也能聽候主人差遣,控制智慧家庭硬體,播放與修改行事曆,未來更預計增加報時、報天氣 、打電話、為行事曆加上排程的功能,還有令人期待的「支援並可辨認多使用者」,這將大幅提升智慧家庭的可能性,針對家庭中不同的成員發展更具個人化的服務,未來結合 Google 多元的應用,將讓使用者達到便利生活新境界。

目前 Google Home 在體驗上已具備許多優點,像是可透過 Google Action 增加功能、透過 Google Assistant Kit 滲透至其他裝置,讓 Google Home 在 DIY 及擴充這一方面有較大的空間,只要符合「要求-回應」模式的功能和任務,用說的就會通,加上 Google Home 本身就是可與 Chomecast 連線顯示的智慧 WiFi 音箱,只要出一張嘴,就能解決居家問題與提供休閒娛樂。雖相對Echo是後進者,但因Google應用已深入生活,後勢不容小覷。

特別有趣的是,Google針對Maker推出紙箱版的Google Home,造成不小的關注,是Maker熟悉語音介面開發的入門好物,又可享受動手做的樂趣。

Google用Raspberry Pi為開發板推出了Google Home紙箱版的Voice Kit。(Source

3、包山包海的Amazon Echo家族

Echo 系列從2014年 Amazon 推出至今已經出了三代的產品:Echo、Tap、Echo Dot,除外型、價格不同外,功能也有差異。

相較前兩者,更早出手的 Amazon Echo 已將聲控應用的觸角伸往生活各個層面。Echo 系列從2014年 Amazon 推出至今已經出了三代的產品:Echo、Tap、Echo Dot,除外型、價格不同外,功能也有差異。最近推出的新版Amazon Dash Wand也支援Alexa語音服務,相信會有愈來愈多支援週邊出現。

除了自家產品,許多大廠都推出了整合Alexa服務的語音概念產品,像是 GE 智慧檯燈、 Samsung 吸塵器、 LG 冰箱,甚至是 Ford 車款等等,即便 Alexa Skill 目前不允許外部通知驅動是一大限制,但 5/16宣布將實驗「 Skill 選用啟動通知」,待實驗完成會發布 SDK ,將成為該產品的另一契機。

Echo 在硬體方面有七個矩陣麥克風,本身可當藍芽喇叭,軟體技術則是自家訓練模型的 Speech to text (STT)及語音音質溫暖的 Text to speech (TTS),可完成的語音任務已包羅萬向,例如:互動語音遊戲、音樂與音效、有聲書、線上電台、預訂(訂票、訂餐、叫車)、智慧家庭硬體控制,除此之外, Echo 在第三方的多樣合作下,硬體廠商可以更自由發揮,是 Echo 一大優勢!

總結

隨著硬體及軟體的進步,人們對於語音控制的創意和想像也大大地擴展,或許有一天世上不再需要按鈕,只要一聲令下,各式各樣的任務都能輕易完成。

雖然至今聲控應用尚未全面進入大家的生活中,但是語音助理所搭配的雲端語意辨識能力已是一年比一年精準,支援的語言也增加不少,至此,對於開發者的考驗將不只是技術本身了,而是針對人的需求提出合宜的解決方案。

究竟要將聲控用在何種情境,就有賴各方好手發揮了!

(本文整理自【Maker Hatch Night#68】,主題是「Maker玩聲控,正是時候!」)

小波

Author: 小波

多向分化潛能者,在務實與夢想中不斷突破自我。 熱愛音樂、文字、設計,卻也對商業管理、科技新知有著高度興趣,亦樂於討論社會議題;畢業於台大機械系,曾擔任MakerPRO採訪編輯實習生,現在正努力用才華養活自己。

Share This Post On

Submit a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *