因「反思」而強大:TRM微型模型打敗巨型AI!
三星的700 萬個參數小模型 TRM 研究,挑戰了大型語言模型的推理霸權,也讓人重新思考人工智慧的發展方向:也許智慧並非來自堆疊,而是來自結構的設計、推理的循環,以及反思的能力。
PyTorch Lightning:讓深度學習更高效、更乾淨的框架
PyTorch Lightning 的出現,代表著深度學習工程實踐的一次質變。它並未重新發明 PyTorch,而是讓 PyTorch 更乾淨、更高效、更具生產力。
WorldVLA:視覺、語言與動作的融合之路
WorldVLA 是一個自回歸動作世界模型,它將動作和圖像的理解與生成統一起來。 WorldVLA 將視覺-語言-動作 (VLA) 模型(動作模型)和世界模型整合在一個框架中。
ML.ENERGY能效排行榜:讓你看見LLM回應背後的電表數字!
密西根大學研究團隊推出的 ML.ENERGY Leaderboard 能效觀測排行榜,透過名為 Zeus 的開源測量工具,能精準追蹤 CPU、GPU 在 LLM 推論過程中的能耗,並以公開數據的形式排名,讓外界第一次能清楚看見「AI 回應背後的電表數字」。
Helix Model:讓人形機器人真的懂你!
Helix 的誕生,標誌著人形機器人真正邁向家庭應用的關鍵一步。它不僅能快速而精確地控制整個上半身,還能理解語言、泛化到從未見過的物品,甚至在多機器人場景中協作。