|
【AI知多少】單模態到多模態:LLM、VLM、Video-LM
3 月14

【AI知多少】單模態到多模態:LLM、VLM、Video-LM

從單模態的LLM出發,目前的AI正如火如荼朝向多模態模型發展,特別是處理語言 + 平面視覺或連續視覺的VLM及Video-LM模型,讓AI看圖說故事或說故事生影片的情境成真了。

Read More
【從科幻到現實】勾勒AI未來情境 (下) – 以假亂真的AI世界
1 月10

【從科幻到現實】勾勒AI未來情境 (下) – 以假亂真的AI世界

本文要談的是AI如何讓「虛擬」與「現實」的界限更模糊了,其中生成式AI正是重要的推手,不僅造就了Digital Human,也讓元宇宙有機會成真。

Read More
【從科幻到現實】勾勒AI未來情境 (上) – 迎接AI服務時代
12 月18

【從科幻到現實】勾勒AI未來情境 (上) – 迎接AI服務時代

本文將勾勒未來AI樣貌 – AI服務時代,包含無所不在的AI生成服務、自動且更自主的工作流程,以及打造專家AI分身模型。

Read More
如何使用Intel AI PC及OpenVINO實現虛擬主播
12 月16

如何使用Intel AI PC及OpenVINO實現虛擬主播

為了使大家能更進一步理解如何實作一個簡單離線版(邊緣端)的虛擬主播,可以輸入所需文字,產生對應語音,配合閉嘴人物影片生成新的對嘴影片。接下來就分別從「推論硬體及環境建置介紹」、「MeloTTS 文字轉語音生成」、「Wav2Lip 自動對嘴影片生成」及「建置完整虛擬主播」等四大部份作更進一步說明。

Read More
掌握「多模態視訊模型」現況與開發流程
12 月02

掌握「多模態視訊模型」現況與開發流程

目前AI生成已從文本/語言應用走向多模態,特別是影像及影片,本文針對多模態影片模型及框架進行介紹。

Read More
【多模態時代】LLaVA模型的重要性
11 月11

【多模態時代】LLaVA模型的重要性

本文介紹當紅多模態模型 – LLaVA與LLM的關係,以及其重要性、可行性及推薦學習資源。

Read More