作者:歐敏銓
承上篇,這一篇要談的是「虛擬」與「現實」的界限,正因為AI而變得愈來愈模糊,而生成式AI扮演著關鍵的角色。
事實上,AR、VR、MR、XR等技術,多年來以虛實交融的沈浸式體驗為終極目標在發展著,只不過,大眾始終有些難以親近。如今,基於LLM、Multimodal的生成式AI橫空出世,不論文字、圖片、音樂、音訊和影片,都能下咒語來生成,逼真程度已大幅降低虛擬世界的「創造成本」,除了殺出一片創新應用的市場、引發「深偽」(Deepfake)亂像外,同時也朝「元宇宙」(Metaverse)的情境不斷靠近。
這個AI虛擬生成的內容,現階段的兩大發展主軸,分別是相對於人物角色的「數位人類」(Digital Human),以及相對於環境的數位情境,例如「數位孿生」(Digital Twin)。當然,兩大主軸會朝著融合的方向發展,也就是走向真假難分的元宇宙虛擬世界而去。
AI伴侶時代來了?
先來看看Digital Human,也就是透過AI生成虛擬世界的人類角色,這些角色可能在現實世界真有其人,也可能是虛構創造出來的。「他們」的發展日新月異,從靜態圖片(商品模特兒)到會說話的動態影片(AI美女主持人),再進一步能與人互動,於是可提供客服諮詢、預約排程,甚至是AI伴侶等服務,或被有心人用於詐騙或假消息的傳遞。
以紅極一時的Caryn AI為例,這是一款AI Chatbot,但很有「個性」,也就是採用了美國性感網紅Caryn Marjorie的2000小時影片來進行訓練,讓訓練出來的AI分身能給花了錢的大爺們有和 Caryn 本人在聊天的體驗,簡直是電影《Her》的現實重現。
這個「虛擬女友」聊天服務每分鐘收費一美元,一推出就爆紅,也讓授權的網紅及服務公司(Forever Voices)賺滿荷包:Caryn AI上線1個月的時候,在Telegram相關群組裡已有1.8萬人,想要和Caryn AI聊天要等96小時。
不過,值得關注的是,Caryn AI在問世8個月後(中間進版2.0,換過一次平台),被Caryn Marjorie本人給下架了,理由是這個分身的談話尺度太大、太容易「失控」,讓她自己都看不下去了,寧願自斷財路以保清白。
然而,除了從「食色性也」的角度來推斷,AI情人的服務不會消失,還會隨技術發展愈來愈逼真外,從「陪伴」、「舒壓」等情感支持的角度來看,AI伴侶仍有其正面的需求價值,而且這個AI角色也不一定要模擬真人,也可以是遊戲角色或寵物,甚至可以自己量身訂作(如Replika、Character.AI)。
至於數位角色能多真實呢?從Caryn AI的體驗來看,Chatbot的英文對話能力已頗成熟,但若想用「視訊」的方式來互動,技術的實現上還有很多挑戰,其中很大的關鍵取決於多模態(Multimodal)AI的發展。所謂多模態AI,指的是對人類溝通的各種介面,包括語音、文字、手勢、面部表情等方式的理解,而且還需要結合情境及情緒,甚至是人際關係、成長背景、需求動機等,才能做出最正確的理解和回應,實現起來並不容易,但以AI的跳躍式發展,也是指日可待吧。
》延伸閱讀:
【RAG for Vision】如何結合RAG建構Multimodal電腦視覺系統
AI讓虛擬實境成真
打破虛實界限的另一個AI發展,則是虛擬世界的模擬或創造,這對遊戲內容生成(Procedural Content Generation, PCG)非常實用,讓遊戲能運用AI圖像(Stable Diffusion、DALL·E 3、MidJourney)及動畫(Genie 2)生成技術,根據玩家的行為及遊戲規則來自動生成無窮盡的遊戲世界,例如在《Minecraft》中空間開創,或《No Man’s Sky》、《Eve Online》的宇宙探索。
》延伸閱讀:一句話實現你的創作夢:熱門AI影音生成工具大解析!
另一個虛擬世界的創造方向,則要求很真實,真實到不只是虛實外觀一致,「內在」也要一致,也就是所謂的Digital Twin。
從定義上來理解:Digital Twin(數位孿生) 是一項將物理世界的實體或系統以數位模型方式複製的技術,透過即時數據、模擬、分析和預測,實現物理與虛擬世界的無縫互動。其核心技術涵蓋外在環境的IOT數據採集、數據傳遞與分析、數位模擬與建模等,這些技術都與AI息息相關,例如環境數據是 AI 模型訓練和推論的基礎,而透過學習,AI可進行虛擬模擬並進一步提供決策建議或行動。
也就是說,Digital Twin是要創建一個與「理想現實」極為接近的虛擬情境,在這個情境中去不斷動態調整條件,模擬找出最理想的結果,再付諸行動。
舉例來說,麥當勞要在台北某區開店,先在電腦中創建這家店的Digital Twin,設定好這家店的空間(大小、動線、商品等等),以及周遭環境(車流、人流、店家等等),再將過往的營運經驗AI模型灌入,開始模擬開店的各種可能狀況,如果分析結果:這家店會賺錢再來開,可以開的更有信心。
類似的「預判」需求層出不窮,例如製造業的新廠選址、生產線運行模擬,交通上的號誌管理、自動駕駛,醫療上的手術模擬、新藥研發等,都可因Digital Twin技術而省下大量的錯誤嘗試成本,讓事情走在正確、可控的道路上。
不過,可想而知,愈真實的「模擬」,需要整合愈複雜的技術,以及更強大的運算能力,開發成本也更是可觀。所以,即使今日已有一些導入Digital Twin的成功案例(例如GE航空為每個飛機引擎建立Digital Twin模型來即時監控引擎性能,進行預測性維護),但仍是令多數企業卻步的技術領域。
小結
今日的AI,正在為下一步「虛實交融」的元宇宙體驗鋪路,在不久的未來,每個人可能都有自己的AI替身,而且不只一個,同時在不同的平行世界與其他的AI替身一同「生活著」。在這發展的過程中,勢必出現一波又一波的職業淘洗、社會角色適應,以及創新、創業契機。
下一篇,將來談談更「科幻」的未來。
- 【從科幻到現實】勾勒AI未來情境 Part 2 – 以假亂真的AI世界 - 2025/01/09
- 【從科幻到現實】勾勒AI未來情境 Part 1 – 迎接AI服務時代 - 2024/12/18
- 為Edge AI而生的SLM:TinyLlama - 2024/11/28