|
訓練機器人互相學習:DeepMind 的 RT-X基礎模型
4 月28

訓練機器人互相學習:DeepMind 的 RT-X基礎模型

本文介紹由Google DeepMind主導推動的通用機器人AI基礎模型 – Robotic Transformer的先進模型:RT-X。

Read More
Super版NVIDIA Jetson Orin Nano到底多「超級」?技術專家揭密
4 月02

Super版NVIDIA Jetson Orin Nano到底多「超級」?技術專家揭密

瞬間成為熱門話題的Jetson Orin Nano Super到底有沒有那麼「超級」?MakerPRO攜手研華與「夜市小霸王」透過一場線上研討會,與將近400位聽眾分享了該系統的性能實測結果,以及VLM實際部署應用範例。

Read More
【AI知多少】單模態到多模態:LLM、VLM、Video-LM
3 月14

【AI知多少】單模態到多模態:LLM、VLM、Video-LM

從單模態的LLM出發,目前的AI正如火如荼朝向多模態模型發展,特別是處理語言 + 平面視覺或連續視覺的VLM及Video-LM模型,讓AI看圖說故事或說故事生影片的情境成真了。

Read More
【從科幻到現實】勾勒AI未來情境 (下) – 以假亂真的AI世界
1 月10

【從科幻到現實】勾勒AI未來情境 (下) – 以假亂真的AI世界

本文要談的是AI如何讓「虛擬」與「現實」的界限更模糊了,其中生成式AI正是重要的推手,不僅造就了Digital Human,也讓元宇宙有機會成真。

Read More
【從科幻到現實】勾勒AI未來情境 (上) – 迎接AI服務時代
12 月18

【從科幻到現實】勾勒AI未來情境 (上) – 迎接AI服務時代

本文將勾勒未來AI樣貌 – AI服務時代,包含無所不在的AI生成服務、自動且更自主的工作流程,以及打造專家AI分身模型。

Read More
如何使用Intel AI PC及OpenVINO實現虛擬主播
12 月16

如何使用Intel AI PC及OpenVINO實現虛擬主播

為了使大家能更進一步理解如何實作一個簡單離線版(邊緣端)的虛擬主播,可以輸入所需文字,產生對應語音,配合閉嘴人物影片生成新的對嘴影片。接下來就分別從「推論硬體及環境建置介紹」、「MeloTTS 文字轉語音生成」、「Wav2Lip 自動對嘴影片生成」及「建置完整虛擬主播」等四大部份作更進一步說明。

Read More