Posted By MakerPRO編輯部 on 12 月 2, 2024 in AI關鍵技術, Multimodal, Vision Transformer, 技術導讀
目前AI生成已從文本/語言應用走向多模態,特別是影像及影片,本文針對多模態影片模型及框架進行介紹。
Posted By MakerPRO編輯部 on 11 月 11, 2024 in LLaVA, Multimodal, 技術導讀
本文介紹當紅多模態模型 – LLaVA與LLM的關係,以及其重要性、可行性及推薦學習資源。
Posted By MakerPRO編輯部 on 9 月 30, 2024 in Edge AI教學文, Multimodal, RAG, 技術導讀
結合AI電腦視覺與RAG的Visual RAG已被視為是下一代AI應用進步的關鍵,本文介紹它的技術架構與應用案例。
只需留下E-Mail,即可獲得最新的知識文章分享和第一手的活動資訊 !