關於此課程
課程主旨
在半導體無塵室或高噪音的機房環境中,透過語音進行即時數據查詢與設備控制,能大幅提升作業效率並落實雙手操作安全。本課程由嵐奕科技莊志偉總經理指導,帶領學員從硬體端(Realtek Ameba Pro 系列)出發,串接 Gemini 與 ChatGPT 等頂尖 LLM API,實作低延遲的語音串流技術。
課程涵蓋從 Arduino IDE 開發環境、Node-RED 系統架構,到使用 Docker 與 n8n 打造完全私有化的 AI 大腦。透過 12 小時的實踐,學員將掌握如何構建一個從 Edge 採集到雲端(或本地 Server)判斷的完整交談式 AI 系統,實現智慧廠務的語音數位化轉型。
學習目標
- 硬體端整合開發: 掌握 Realtek Ameba Pro SDK 與 Arduino IDE,實現 Edge 端語音採集與傳輸。
- 通訊協定實務: 熟練 MQTT 技術於語音串流之應用,確保邊緣裝置與主機間的即時互動。
- 主機架構搭建: 學會利用 Node-RED 與 Docker 佈署 STT/LLM/TTS 服務,構建 AI 控制中樞。
- 自動化工作流: 整合 n8n 工具與 API,實現具備邏輯判斷與私有化數據處理能力的 AI 助理。
適合對象
- IC 製造業 IT/自動化工程師: 負責開發廠區智慧終端、語音操作介面或即時通報系統者。
- 設備管理與廠務人員: 欲導入 AI 語音助理輔助巡檢、維修與製程參數查詢者。
- 半導體相關硬體開發人員: 需了解如何將 AI 語言模型應用於嵌入式裝置(MCU/SOC)者。
- 企業數位轉型部門: 評估私有化 AI 語音服務安全性與可行性的技術主管。
課綱規劃
Day 1:Edge 端裝置開發與雲端 API 整合
| 時間 | 單元主題 | 教學內容重點 |
|---|---|---|
| 09:30 – 11:00 | 1. Edge 終端硬體開發基礎 | Realtek Ameba Pro 開發板介紹、Arduino IDE 與 SDK 配置、WiFi/MQTT 連線實作。 |
| 11:00 – 12:30 | 2. 語音採集與串流技術 | 麥克風數據採集、語音編碼、運用 MQTT 實現 Edge 到雲端的即時語音流傳輸。 |
| 13:30 – 15:00 | 3. 主流 LLM API 串接實務 | 整合 Gemini API / ChatGPT API、Prompt Engineering 基礎、對話情境設計。 |
| 15:00 – 16:30 | 4. Node-RED 系統架構基礎 | Node-RED 環境架設、串接 API 節點、初步實現語音轉文字 (STT) 與對話邏輯。 |
Day 2:私有化大腦搭建與自動化工作流整合
| 時間 | 單元主題 | 教學內容重點 |
|---|---|---|
| 09:30 – 11:00 | 5. 打造私有 AI Server 架構 | AI Server 開發流程、Docker 環境快速佈署、本地端 AI 服務 (TTS/STT) 配置要點。 |
| 11:00 – 12:30 | 6. 進階技術疊加:MCP 與語音優化 | 導入 MCP 協議擴充功能、多人使用環境下的語音衝突管理、語音合成 (TTS) 優化。 |
| 13:30 – 15:00 | 7. n8n 自動化服務整合 | 搭建 n8n 自動化流程、串接廠務資料庫、實現「問答即動作」的智慧助理邏輯。 |
| 15:00 – 16:30 | 8. 綜合實戰:完成私有語音服務 | 整合 Edge 裝置與私有大腦、現場實測與除錯、安全性與資安防護總結、Q&A。 |
學員評分和評論
還沒有評論