從多模態到全模態:AI 邁向理解世界的下一步
Gemini 2.5 Pro、GPT-4o 與 Claude 3.7 Sonnet等模型正走向全模態這條路,而全模態模型的成熟,將成為通用人工智慧(AGI)是否可能實現的關鍵里程碑。
【AI知多少】單模態到多模態:LLM、VLM、Video-LM
從單模態的LLM出發,目前的AI正如火如荼朝向多模態模型發展,特別是處理語言 + 平面視覺或連續視覺的VLM及Video-LM模型,讓AI看圖說故事或說故事生影片的情境成真了。
【2024 MAI Talks】陳縕儂:打造台版LLM的理由與挑戰
在台大資工系陳縕儂副教授主講的「打造台版LLM的理由與挑戰」演講中,主要討論了建立台灣版大型語言模型(LLM)的必要性及挑戰,並分享了她和她的學生在這方面的努力和成果。
為什麼Gemma採取Decoder-Only Transformer架構呢?
本篇文章會說明Gemma為何會採取Decoder-Only Transformer架構,並針對Decoder-Only Transformer架構進行介紹。