根據TrendForce最新研究,DeepSeek近期連續發表DeepSeek-V3、R1等AI模型,使終端客戶未來更審慎評估投入AI基礎設施的合理性,採用更具效率的軟體運算模型,以降低對GPU等硬體的依賴。雲端服務供應商(CSP)則可能擴大採用自家ASIC基礎設施,以降低建置成本。因此,2025年以後產業對GPU AI晶片或半導體實際需求可能出現變化。
TrendForce表示,全球AI伺服器市場自2023年起快速成長,預期2025年佔據整體伺服器出貨比例將超過15%,到2028年可望接近20%。近年大型CSP業者為因應AI訓練需求積極擴建,自2025年起將擴展重心至邊緣AI推論,除了採用NVIDIA Blackwell等新一代GPU平台,AWS等也加大開發自家ASIC力道,以提升成本效益、滿足特定AI應用需求。中國CSP和DeepSeek等相關AI業者面對美國晶片出口禁令,著重開發更高效的AI晶片或演算法,以促進AI需求和應用的多元發展。
AI產業過去是依賴擴大模型、增加資料量和提升硬體性能來發展,但成本與效率成為挑戰。DeepSeek採用蒸餾模型(Model Distillation)技術,壓縮大型模型以提升推論速度並降低硬體需求,同時充分發揮NVIDIA Hopper降規版晶片的效益,最大化運算資源利用。其優勢來自高性能硬體選擇、新型蒸餾技術及API開源策略,不僅最佳化了技術與商業應用的平衡,也展現AI產業向高效發展的趨勢。
TrendForce預期,在美國晶片禁令持續的情況下,中國市場將朝兩個重點方向發展:首先,相關業者將加速投入自主AI晶片或供應鏈發展,如中系大型CSP業者除了會盡量採購目前尚可取得的H20外,未來將加速擴大開發自有ASIC,應用於自家資料中心。其次,中國將利用既有的網際網路基礎優勢,以軟體補足硬體缺陷,前面提到DeepSeek打破常規,改採蒸餾技術強化AI應用機會就是一個例子。
整體而言,預期未來美國政府可能對中國相關AI或半導體採取更嚴格禁令,迫使欲投入AI發展的中國業者加速發展自有AI晶片或HBM等硬體。儘管其性能表現不及NVIDIA等GPU方案,但因為主要目的是滿足中國市場自用資料中心基礎建設,晶片的性能已非唯一考量。此外,DeepSeek等業者近期會朝AI多模態模型發展,力求在更低的訓練成本下,於特定應用領域達到類似效能,以加速實現商用化。
- TrendForce:DeepSeek崛起凸顯AI產業將更注重高成本效益 - 2025/02/04
- Alif第二代Ensemble MCU將為邊緣裝置實現低功耗生成式AI - 2025/02/03
- 第三屆晶心盃RISC-V創意大賽 設計巧思百花齊放 - 2025/01/23