作者:陸向陽
創客領域主要有三,電子嗜好樂趣、STEM教育、產業實務應用。嗜好樂趣方面有單純的電子藝術創作、競賽、解決個人或個案問題等,但近年來也有一個衍生發展,即懷舊(Retro),運用新的電子板卡復古重現以前的電子產品,或重新詮釋等,屬於比較年長的創客所喜愛的。
而近期就有一位名為Zoltan T(Zoltan Toth-Czifra)的創客,運用復古的轉盤式室內電話,來與最先進熱門的ChatGPT互動,事實上在此之前就有一位名為Ryder Damen的創客運用復古話機與Google Assistant/Google Search進行語音互動,類似筆者因電信綁約而獲得的Google Nest Mini智慧喇叭,可以用語音與喇叭互動,背後連線溝通運作的其實也是Google Assistant/Google Search。
復古話機主要是麥克風與喇叭,沒有語音轉文字、文字轉語音的能力,也無法連上Internet,這些都透過樹莓派電腦來完成,而Zoltan T把Google Assistant/Google Search換成ChatGPT則更具智慧性與互動深度。
因為,依筆者過去至今的使用經驗,Google Nest Mini經常回答不懂我詢問的問題,或給出大大離譜、誤解的回答。相對的,筆者與ChatGPT文字對話,ChatGPT雖然會認真的胡說八道,但理解的智慧性與表達的口語性方面都比Google Assistant高竿不少。
更厲害的是,Zoltan T把ChatGPT的回覆文字轉語音後,還能轉成不同國家的腔調,如德語、法語等,而Zoltan T所用的復古話機即是德國製,使用德語口音有一種更吻合匹配的感覺。
細節說明
了解概念再來說明細節,其實Zoltan T也是用樹莓派電腦來實現語音轉文字(使用開源的Whisper)、連上Internet與ChatGPT雲端服務互動,而後再把文字轉語音,相關的軟體開發主要是用Python程式語言。
至於如何讓樹莓派與復古電話連接,這是這個專案關鍵的一部分,德國復古電話的電話線路其實是用德國TAE連接器,必須先用手動焊接,把連接器的對應接腳轉接成一般現代電話常見的RJ-11連接器。
然後,RJ-11還是無法直接接上樹莓派,要再透過一台Grandstream公司的HT801轉接盒(Amazon上約35歐元,台灣也有廠商賣,約1,490元新台幣)才行,該轉接盒的學名為FXS VoIP閘道器,透過該盒把RJ-11轉成乙太網路常見的RJ-45,把復古電話的語音轉換成VoIP語音,再與樹莓派連接。
樹莓派也不是單純硬體線路接上RJ-45就能運作,傳輸的協定也必須能通、能解析才行,這時樹莓派上就要執行SIP伺服器軟體,以命令列打python3 rotarygpt.py來執行。SIP是VoIP的協定,如此才能正確接收HT801傳送過來的VoIP語音,進一步轉成文字,傳送到Internet上的ChatGPT。
還有,HT801也不是隨插即用,也是需要事先進行設定的,設定方式很類似今日的家用無線路由器,用瀏覽器瀏覽該裝置的內部IP,登入之後才進行相關設定。
正式使用
完成上述後,在正式使用上,其實也不是把復古轉盤話機的話筒拿起來就能使用,是要撥打給樹莓派的,假設樹莓派的內網IP為192.168.1.140,則要用轉盤轉出*47192*168*1*140*5060,其中*47只是一個單純一定要加的前綴碼,之後才正式帶入IP位址數字,並以*代替.來隔開,至於最後的*5060其實是指Port,即SIP協定一般使用5060埠來傳輸。
至於最前頭提到的腔調口音部分,筆者檢視了一下Zoltan T的Python原始程式碼,大體有15種選項,絕大多數是歐美腔調,但也有印度腔、日本腔可選。
另外Zoltan T也提供一個基本的播報天氣功能(function)程式,可透過OpenMeteo來取得天氣狀況,此外也開發了3個額外的選用功能,但都需要額外安裝函式庫才能使用,例如用來連接Philips HUE智慧燈泡、連接Spotify音樂、連接Samsung智慧電視(使用Tizen作業系統)等。
小結
最後,老實說,這個專案的耍酷成份比較高,秀了一段復古話機轉接成SIP協定的VoIP後,再與ChatGPT的現代Internet服務整合,僅供參考了!
- Sony強力加持!樹莓派發表專屬AI攝影機 - 2024/10/28
- 【Qualcomm Inside】12TOPS Edge AI單板RUBIK Pi規格剖析 - 2024/10/20
- TinyML潛力股!MicroFlow挑戰TensorFlow Lite for Microcontrollers - 2024/10/15