輕鬆用Intel AI PC及OpenVINO建立數位分身
一個完整的數位分身,就像真人一樣,要具有自然語言對話、豐富肢體動作和產生生動表情的能力,其中就需要用到許多生成式AI技術,包括利用語音轉文字(STT)得到問題的文字,交給大語言模型(LLM)進行文字問答,再將文字轉語音(TTS)把答案讀出,最後再配合語音自動對嘴形(Lip Sync)讓人物影像的嘴巴也能和語音同步動起來。
【從科幻到現實】勾勒AI未來情境 (下) – 以假亂真的AI世界
本文要談的是AI如何讓「虛擬」與「現實」的界限更模糊了,其中生成式AI正是重要的推手,不僅造就了Digital Human,也讓元宇宙有機會成真。
如何使用Intel AI PC及OpenVINO實現虛擬主播
為了使大家能更進一步理解如何實作一個簡單離線版(邊緣端)的虛擬主播,可以輸入所需文字,產生對應語音,配合閉嘴人物影片生成新的對嘴影片。接下來就分別從「推論硬體及環境建置介紹」、「MeloTTS 文字轉語音生成」、「Wav2Lip 自動對嘴影片生成」及「建置完整虛擬主播」等四大部份作更進一步說明。