【啟動AI Maker世代 】2024 MAI 開發者社群大會(5/16-17)
|

【AIGO交流會】讓AI更親民!自然語言處理的開發挑戰

   

作者:王姵文

繼在台北、台中、高雄舉辦了系列AI社群交流會及論壇後,AIGO 搭上了最近火紅的智慧音箱與Chatbot議題,針對兩者背後的核心技術 - 自然語言處理(Natural Language Processing,NLP)舉辦了一場《自然語言處理的開發挑戰》交流會,並邀請了資訊科技顧問顏浚原 ,和希納蒙人工智慧公司的兩位AI Researcher劉冠宏和楊哲寧,來分享如何透過自然語言處理,讓機器精準的掌握語言這門複雜的技能。

第五場AIGO交流會討論自然語言的開發挑戰,吸引眾多AI社群參加(攝影:歐敏銓)

聊天機器人的深度學習開發技術

首先登場的是顏浚原講師,他提到Siri剛推出時不夠完善,蘋果也是靠廣大的消費者來測試,然後去做改善;Chatbot也是同樣的問題,要面對不同語言的使用者,講中文還會有鄉音,或是用國語、台語、客語夾雜,甚至還夾雜少量的英文,有時候還會遇到相同的音在多個語言意思不同,這些都是在語音辨識裡會遇到的很大挑戰。

另外在使用的情境上比較難做分辨,例如目前Siri語音助理最多應用的是在提醒方便的功用,例如設鬧鐘、提醒煮菜還要多久等等,或是叫語音助理可以在開車時幫發簡訊,但Siri只能一個命令一個動作,當命令的步驟很多時,Siri不會知道每一個步驟的斷句在哪,目標是要做什麼。

顏浚原提到大家都說AI很厲害,但手邊可以用到的Siri卻沒有那麼厲害,強調過去是知識經濟時代,現在是體驗經濟時代,很多技術的發展是跟著經驗走,廠商在應用某些技術時,其實最後的商業化產品或服務還不到位,甚至廠商自己都說不清楚,使得這些東西離滿意的使用者體驗還是有一段距離。

顏浚原講師分享關於聊天機器人的開發(攝影:歐敏銓)

語音助理所面臨的挑戰

顏浚原講師進一步分享更多開發語音助理服務時會遇到的挑戰,首先就是語音辨識,多數主流的開發商都有提供API讓人去串接,如果只是想要測試一個服務情境,第一步可以先去搜尋開源資源來把前面的語音分析做出來,有些套件可以把語音裡沒人講話的地方剪掉,甚至可以把語音剪成一段一段,方便之後做數據分析。

在做語音助理時,還有一個問題是語料從哪裡來,不同的種族的口音其實不太一樣,這個語料從哪裡來,跟產品跟要推的市場很有關係。還有去雜訊的問題,使用者常常傳過來的有很多背景音,要看智慧音箱放置的位置是在哪裡,如果是在咖啡廳,就會收到音樂的聲音,音箱可能要用指向性的麥克風把背景音樂消除,要先把語料弄成乾淨的sample,後期處理才能正確辨識出他在講什麼。

通常在教Chatbot學語言時,第一個挑戰是教機器人如何斷句;在處理使用者到底在講什麼時,例如像是開燈或關燈,可以有好多種說法,就要先去蒐集夠多不同人不同種說法。另外人類會預測別人說的下一句會出現什麼,同樣的機器學習也可以預測第四句或第五句要講什麼,這可以用狀態機器去訓練模型達到我們的預期。

如何運用文字和與語言打造智慧辦公室

接著登場的是希納蒙(Cinnamon AI )公司 的劉冠宏研究員,他分享了希納蒙怎麼做AI project 的工作流程:當客戶提出需求或團隊內自己發想,根據需求蒐集相關的data,去建立模型後,先驗證再佈署,這是一個AI project必經的流程,中間如果發生問題時,就要回過頭去看是資料量不夠,還是建立的模型不對。

劉冠宏分享希拉蒙在執行AI project的工作流程(攝影:歐敏銓)

然後是由楊哲寧研究員來分享關於NLP運用的部分,他強調客戶最想要看到的是怎麼從大量的文本裡把有用的資訊萃取出來,因此,他們的任務是設計出一個能辨識出哪些是需要資訊的模型(Model),而一個有用的模型往往是站在「人」的角度切入去設計出來的。例如得到人體資訊的兩個數值175和64,人們很容易會判斷身高是175,體重應該是64,所以人在判斷時會看語意的訊息,和這個數值它在的位置。

楊哲寧說:「通常要解決問題有超多方法,希納蒙的做法是你要先思考人怎麼想,再去設計model,往往更有效率。」

楊哲寧講師分享NLP如何應用在辦公室文件的分析(攝影:歐敏銓)

楊哲寧還提到另外的例子,像是小明去菜市場買菜,把這一句話打斷成買菜、去、小明,人的大腦會知道從人事時地物重組一個句子,但一般的model很難這麼做,如果要讓model去讀一篇語音訊息,去讀一個摘要,強迫model去讀,效果往往不太好,若能告訴它一些關鍵的話,可以讓model學得更精準。

「我們人在聽別人說話時不會只聽一個字,我們會聽前後文,例如我吃一個蘋果,跟我用一個蘋果的手機,這兩個蘋果是不一樣的東西。因此,我們的模型也會用先後文來判斷,讓它在做預測時,可以更有效的去修正,出來的結果就會更準確。」

楊哲寧提到小公司如何在AI方面跟大公司做競爭,像是Google會有很多開源軟體,那Google強在資料庫很龐大,運算資源豐富,訓練的model泛用性很好;小公司則應專注在某個領域上,以希納蒙來說,就專注在辦公室的領域上,只要跟辦公室場景有關的語音都要能超越Google,他說:「這是小公司要怎麼跟大公司做AI競賽的不二法門。」

小結

雖然智慧音箱與Chatbot非常熱門,但其背後所要依賴的技術仍有很多問題要克服,消費者體驗起來的服務仍不夠完善,但AI發展勢不可擋,未來將會有更多人才投入研究與應用AI,自然語言處理的應用難題,在技術上的突破相信是時間的問題。

(責任編輯:歐敏銓)

王姵文
王姵文

Author: 王姵文

從滿腦子都是韓劇和KPOP的愛追劇迷妹,意外踏入Maker圈,期許有一天這方面的知識量也能如數家珍。

Share This Post On
468 ad

Submit a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *