作者:陸向陽
DGX Spark是NVIDIA倡議的桌上型電腦(或說是種開發AI用途的工作站)參考設計,提供給各品牌系統商以此為基礎再行修改調整而後銷售。另一款桌上型電腦參考設計為DGX Station,DGX Station內部的主控晶片為GB300,相較於DGX Spark只是名稱、銷售上的更新,DGX Station就有較多的工程意義可以說明。
GB300其實必須追溯自NVIDIA的資料中心AI加速晶片B100、B200,B即Blackwell(統計學家、數學家的名字)的意思,B100、B200其實在電路設計(或稱為微架構Micro Architecture)上全然相同。
但B200主要是因為半導體製程技術的持續精進,能以更快的時脈運作,效能較B100更佳,但相對的也有更高的功耗,B100典型約700~800瓦,B200可以到1,000瓦,幾乎必然使用水冷散熱。
而DGX Spark所用的GB10 Superchip(雖稱為超級晶片,但嚴格來說已是種板卡)推測是取用B100一半的裸晶電路(B100與B200本就是兩個裸晶精密連接而成),再搭配上聯發科協助設計的Arm架構CPU電路,以此構成。而所謂的GB200 Superchip,其實即是用上2顆B100晶片,再搭配1顆NVIDIA的Grace Arm架構CPU,以此構成。
有上述瞭解後,便可進一步瞭解GB300,GB300一樣是Grace Arm CPU+Blackwell GPU(嚴格而論已經不算GPU,已是以乘加器為主的設計,而非著色器,是一種純化的AI加速電路)的搭配,其中Grace Arm架構CPU沒有太大變化,較大變化在B300的部份。
B300研發代號是Blackwell Ultra,B300其實電路設計依然與B100、B200相同,但時脈再拉高,變成效率與功耗也都在提高,其功耗增至1,400瓦,以此推測其效能也是此前B200的1.4倍以上。
另外B300搭配更多容量的高頻寬記憶體(HBM),B100/B200為192GB,B300則為288GB,使晶片效能提升的同時其配套記憶體也有提升,避免產生效能瓶頸。此外DGX Station規格效能明顯高於DGX Spark,故記憶體也增加,DGX Spark為128GB,DGX Station則為768GB。

NVIDIA資料中心晶片後續展望(Roadmap)圖,GB300即為圖中2025年上緣的Blackwell Ultra GPU,並搭配使用8S HBM3e 12H的記憶體(圖片來源:NVIDIA)
照道理而言,B300/GB300應當與此前的B100/B200/GB200相同,是全然用於資料中心伺服器內的,然筆者推測NVIDIA期望增加B100/B200/B300裸晶的生產量,以便獲得更大的量價均攤效益,故也將其推展到前端(資料中心屬於後端)系統上,因而有DGX Station。事實上GB10就已經有盡可能增加B100/B200裸晶用量的意涵。
(原文連結)