LLaVA | MakerPRO

Home » LLaVA

3 月14

【AI知多少】單模態到多模態：LLM、VLM、Video-LM

從單模態的LLM出發，目前的AI正如火如荼朝向多模態模型發展，特別是處理語言 + 平面視覺或連續視覺的VLM及Video-LM模型，讓AI看圖說故事或說故事生影片的情境成真了。

11 月11

本文介紹當紅多模態模型 – LLaVA與LLM的關係，以及其重要性、可行性及推薦學習資源。