隨著AI持續顛覆各個產業,企業對於兼顧成本效益和可以快速開發並布署基礎設施的需求愈趨成長。因應需求攀升,英特爾推出搭載效能核心(P-core0的Xeon 6和Gaudi 3 AI加速器,強化公司致力於提供具備每瓦最佳效能且降低總持有成本(TCO)之強大AI系統的承諾。
英特爾執行副總裁暨資料中心與AI解決方案總經理Justin Hotard指出:「AI需求帶動資料中心大規模轉型,產業因此開始在軟硬體和開發工具上尋求更多選擇。英特爾推出搭載P-core的Xeon 6和Gaudi 3 AI加速器將促進開放生態系發展,使我們的客戶能以更佳的效能、效率和安全性,滿足所有工作負載。」
英特爾AI基礎架構最新進展包括為資料中心產品組合增加兩大產品:
- Intel Xeon6搭載效能P-core:專為處理運算密集型的工作負載而設計,並兼顧優異效率。相較於上一代處理器,Xeon 6提供2倍的效能提升,不僅核心數增加、記憶體頻寬加倍,更將AI加速功能嵌入每個核心。英特爾此款處理器,專為滿足邊緣到資料中心和雲端環境的AI效能需求而打造。
- Intel Gaudi 3 AI加速器:特別為大規模生成式AI最佳化的Gaudi 3,具備64個張量處理器核心(TPC)和8個矩陣乘法引擎(MME),能加速深度神經網路運算。此外,還包括用於訓練與推論的128 GB HBM2e記憶體,以及用於可擴充網路的24個200 Gb乙太網路連接埠。Gaudi 3提供了與PyTorch框架、先進的Hugging Face Transformer模型和diffuser模型無縫的相容性。英特爾近期宣布與IBM合作,將英特爾Gaudi 3 AI加速器做為服務布署至IBM Cloud上,期待透過這項合作,客戶在使用AI與擴充AI規模時,能同時強化效能與降低TCO。
大規模布署AI涉及各種考量因素,包括靈活彈性布署的選項、具競爭力的價格效能比,以及可用的AI技術等。英特爾強大的x86架構與廣泛的開放生態系,使其能夠支援企業建構具備最佳化TCO及每瓦效能的高價值AI系統。值得一提的是,市場上高達73%的GPU加速伺服器是使用Intel Xeon系列處理器作為伺服器處理器(host CPU)。
英特爾與領導OEM夥伴合作包括與戴爾(Dell)和美超微(Supermicro)開發共同設計的系統,以滿足客戶在有效AI布署的特定需求。Dell爾科技與英特爾正共同設計適用於Gaudi 3和Xeon 6且以檢索增強生成(RAG)為基礎的解決方案。
在生成式AI解決方案由原型設計推進至量產就緒的過程中,將面臨即時監控(real-time monitoring)、錯誤處理(error handling)、記錄日誌檔(logging)、安全性和可擴充性等方面的挑戰。英特爾與OEM廠商和其他夥伴合作,透過共同設計處理這些挑戰,推出量產就緒的RAG解決方案。
這些解決方案建立於Open Platform For Enterprise AI (OPEA)平台之上,將基於OPEA的微服務架構整合至可擴充的RAG系統,並針對Xeon和Gaudi AI系統進行最佳化,其目的為協助客戶輕鬆整合Kubernetes、Red Hat OpenShift AI和Red Hat Enterprise Linux AI的應用程式。
Intel Tiber產品組合提供企業解決方案,該方案能解決橫跨AI、雲端與邊緣環境的各種挑戰,包括存取、成本、複雜性、安全性、效率和可擴充性。Intel Tiber Developer Cloud現提供英特爾Xeon 6預覽系統,可供技術評估與測試使用。此外,特定客戶可搶先體驗英特爾Gaudi 3,以驗證AI模型布署。Gaudi 3叢集將於下一季開始推出,可供大規模量產布署。
新的服務產品包括Seekr推出的端到端AI平台SeekrFlow,該平台用於開發可信賴AI應用程式。最新更新包括Intel Gaudi軟體最新版本和整合PyTorch 2.4的Jupyter Notebooks、英特爾oneAPI以及AI工具2024.2版本,其中包括全新AI加速功能,並支援Xeon 6處理器。
- 【展望2025】將顛覆你我生活的三大黑科技 - 2024/10/30
- 與益登和NVIDIA一起探索AI與邊緣運算的無限可能! - 2024/10/23
- 【活動報導】更高CP值的Edge AI開發選項:Windows on Arm - 2024/10/22