|

【自造DIARY】如何使用 ROS 1.0 完成語音辨識功能

   
作者:創客萊吧 MakerLab

本篇文章將使用樹莓派與 ReSpeaker 4-Mic Array for Raspberry Pi 來完成語音辨識的功能;並使用 ROS 1.0 系統的多機通訊功能,操控遠端電腦的小烏龜。

在開始閱讀本篇文章前,請先確定下列事項:

本文章範例將會有樹莓派的 Terminal gif 動畫與筆電的 gif 動畫,分辨方式為查看開頭的使用者帳戶與實體主機名稱,如下兩張圖與紅框所示

樹莓派的 Terminal 示意圖(左)、筆電的 Terminal 示意圖(右)(圖片來源:創客萊吧提供)

若上述事項已準備就緒,便可以開始閱讀下列的教學文章囉!

在本篇文章中我們將可以了解到:

  1. 如何使用樹莓派原生系統 Raspbian 安裝 ROS 1.0—Kinetic 版本
  2. 建置使用語音辨識時的工作環境
  3. 即使使用不同的作業系統操作 ROS 1.0,依舊能夠完成多機通訊操作
  4. 使用基於語音辨識系統 Sphinx 的 ROS package「pocketsphinx」完成語音辨識
  5. 利用語音辨識結果與 ROS 1.0,遠端操控 ROS 1.0 tutorial 中的 turtlesim

確認上列事項皆已完成後,我們便可以開始進行本篇文章的教學囉!

實際操作

早在電腦發明前,自動語音辨識的設想已經被提上了議事日程,早期的聲碼器可被視為語音辨識及合成的雛形;而語音辨識技術最重大的突破是「隱馬爾科夫模型(Hidden Markov Model)」的應用,現今大多數的語音辨識或多或少也都與隱馬爾科夫模型的應用有關。

因此本篇文章我們將使用由卡內基梅隆大學的李開復教授,基於隱馬爾科夫模型的大詞彙量語音辨識系統「Sphinx」,搭配 ROS 系統來完成語音辨識的功能。本篇文章將使用樹莓派與 ReSpeaker 4-Mic Array for Raspberry Pi 來完成語音辨識的功能;並使用 ROS 1.0 系統的多機通訊功能,操控遠端電腦的小烏龜。

本文為會員限定文章

立即加入會員! 全站文章無限看~

                               

已經是會員? 按此登入

只需不到短短一分鐘...

輸入您的信箱與ID註冊即可享有一切福利!

會員福利
1

免費電子報

2

會員搶先看

3

主題訂閱

4

好文收藏

CIRCUS Pi

Author: CIRCUS Pi

分享有趣的創作與教學,提供Maker們創作的軍火庫,DIY 零件 | 套件| 工具,官網連結

Share This Post On

Submit a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *