作者:陸向陽

圖1:NVIDIA Jetson Thor開發者套件內部圖(圖片來源:NVIDIA)
近期NVIDIA發表了NVIDIA Jetson Thor的開發者套件與生產模組,接替上一代的Jetson Orin,看來NVIDIA喜歡北歐神話或漫威宇宙,下一代以雷神索爾(Thor,英文的星期四Thursday源自此,即Thor’s Day的變化)為名。
NVIDIA Jetson Orin、Thor主要用於嵌入式AI市場,如邊緣運算、機器人等,若用於車用領域(自駕車、智慧座艙)則為NVIDIA DRIVE Orin、Thor,但其實Jetson、DRIVE兩個系列都是基於同一個晶片架構再行修改變化而成。
有關NVIDIA Jetson Thor的規格已有相關報導,在此不贅述,筆者在此要討論的是Jetson Thor背後的實現工程,如同此前筆者曾討論過DGX Spark的GB10與DGX Station的GB300一樣。
Jetson Thor效能比GB10多一倍
首先是Jetson Thor其實也是使用B100、B200系列(針對資料中心領域的AI加速晶片)的Blackwell架構,推測應當與GB10一樣,是將B100、B200的兩個縫合(打線)裸晶中取一個出來,並降低運作時脈以節制功耗,使其較適合在嵌入式領域應用,並且可能關閉某些功能。
不過Jetson Thor的效能比GB10多一倍,後者約1,000TFlops,前者則為2,070TFlops,這是以FP4精度格式並以稀疏連接的條件下的表現,GB10某種程度是以最基本可用的Blackwell晶片為基礎再行包裝成,相對的GB300則是最具效能突破能力的單顆Blackwell架構的裸晶(顆數尚少或在多晶片系統內難以搭配使用)來構成。
Jetson Thor等於是介於GB10、GB300兩者間,選擇比GB10略佳的裸晶來構成Jetson Thor,在各種硬體數據規格方面Thor多比GB10好一些,但兩者的建議售價接近,Thor開發套件為3,499美元,DGX Spark/GB10則在3,999美元,但不同品牌製造商(如ASUS、Dell等)則可能比3,999美元高些或低階。
不過價格相近效能卻差一倍(以Jetson T5000而言,T4000僅多2成效能),如此可能讓DGX Spark/GB10不好賣,不過DGX Spark/GB10已先行賣半年時間,而且與Thor定位全然不同,GB10是給AI軟體工程師訓練與驗證新AI模型用的,GB10是用來給機器人內部AI推論用的。

圖2 NVIDIA DGX Spark桌上型AI工作站內部圖(圖片來源:NVIDIA)
GB10的NVLink-C2C試煉
此前的GB10也是需要搭配的CPU,此方面NVIDIA與MediaTek合作,NVIDIA提供NVLink的晶片對接版介面,稱為NVLink-C2C,而後由MediaTek客製化設計,將Arm核心的CPU透過NVLink-C2C與Blackwell GPU連接。
GB10內有10個Cortex-X925核心、10個Cortex-A725核心,這兩款核心過往在MediaTek的手機晶片中都用過,嚴格而論NVIDIA大可把自己設計的Grace Arm架構CPU用於GB10,只要減少核心數即可效能匹配,但推測是為了特別試煉NVLink-C2C而不如此做,Grace Arm架構CPU依然只用於搭配B100/200/300晶片。
NVIDIA之所以要試煉NVLink-C2C自然是要推廣NVLink生態系以便遏止UALink生態系壯大,近期NVIDIA入股Intel也有部份動機基於此,NVIDIA期望其AI晶片霸主地位除了有CUDA軟體為護城河外,NVLink介面可以成為另外一個護城河(築高對手的進入門檻、競爭門檻)。
此一合作試煉除了是為了NVLink生態系外,也會是NVIDIA與MediaTek在WoA(Windows on Arm)筆電的試煉,桌機等於是筆電的前哨戰,DGX Spark/GB10功耗持續收斂後即可轉化成筆電版。
也因為是個初步試煉,所以GB10的20個核心可能無法匹配效能加倍的Jetson Thor,故Jetson Thor搭配的CPU核心是由NVIDIA官方出手,以14個Arm Neoverse-V3AE核心來構成,依然不是使用Grace(Neoverse V2)。
另外也可能是NVIDIA先拿Jetson Thor進行升級嘗試,先從14個(少量)核心的Neoverse-V3開始設計,可行後再擴展延伸至Grace系列、升級Grace系列,現行Grace為至少72個(大量)核心的設計。
特別是對NVIDIA而言,其提供Arm架構CPU給用戶主要是給客戶另一個選擇,客戶很可能依然選擇慣用的x86 CPU,NVIDIA的主業務依然是GPU,所以NVIDIA的Arm架構CPU的世代更新週期會較慢。
結語
最後其實很清楚掌握NVIDIA的發展思路,先設計出新的資料中心用AI晶片,以其為基礎,將最佳與最基本的晶片用於工作站,即DGX Statin與DGX Spark,並以DGX Spark為基礎限縮功耗以打入筆記型電腦領域。
同樣以資料中心用AI晶片為基礎,以略高於DGX Spark的規格推出Jetson Thor、DRIVE AGX Thor等,用來支援嵌入式AI、機器人、邊緣運算、車用等領域。
筆者推測,隨著Blackwell裸晶的功耗、效能、良率等有更高的成熟掌握度後,DGX Spark與Jetson Thor等的規格會越來越接近,後續的型款更新或可能同步,或乾脆拿Jetson Thor生產模組同時支援嵌入式與桌上型開發驗證的需求,關於這些推測有待後續觀察驗證。
(責任編輯:謝嘉洵。)
- 以工程角度檢視NVIDIA Jetson Thor - 2025/10/02
- Qualcomm RB系列開發板觀察 - 2025/10/01
- 讓機器也能聞味道:MIT開發SmellNet為嗅覺AI模型打地基 - 2025/08/29
訂閱MakerPRO知識充電報
與40000位開發者一同掌握科技創新的技術資訊!