IT之家 8 月 30 日消息,NVIDIA 現公布了即將推出的基于 Arm 的 Grace 超級芯片的最新測試成績,該芯片將用于下一代數據中心和服務器,號稱可以在同等功耗水平提供競品兩倍的性能。
(資料圖片)
根據 NVIDIA 提供的基準測試結果,與 AMD 最快的 x86 數據中心 CPU“Genoa”相比,Grace 可以在相同功耗下可提供約 1.7~2.5 倍的性能,相比英特爾 Sapphire Rapids 領先幅度更大。
當然,嚴格來說 Grace 并不算傳統意義上的 CPU,它基于 Arm 的 Neoverse N2 核心,采用了臺積電 4N 工藝打造,這種“超級芯片(Superchip)”有 CPU+CPU 和 CPU+GPU 兩種類型。
NVIDIA 最近還公布了旗下最強的 AI 和計算工作負載 GPU——GH200,它配備了世界上最快的 HBM3e 內存,而它也將被 Grace Hopper 超級芯片所采用。
Grace 的一些主要亮點包括:
適用于高性能計算(HPC)和云計算的高性能 CPU
最多 144 個 Arm v9 CPU 核心的超級芯片設計
世界上第一個帶有 ECC 內存的 LPDDR5x,總帶寬為 1TB / s
SPECrate2017_int_base 得分超過 740(預計)
900 GB/s相干接口,比 PCIe Gen 5 快 7 倍
封裝密度是 DIMM 解決方案的 2 倍
支持所有 NVIDIA 軟件堆棧和平臺,包括 RTX、HPC、AI 和 Omniverse。
在 Hot Chips 2023 演示中,NVIDIA 首席科學家 Bill Dally 展示了 NVIDIA Grace Superchip 與其競爭對手之間的性能比較,包括 AMD EPYC 9654(96 核 192 線程)以及英特爾的旗艦產品 Xeon Platinum 8480+(56 核 112 線程)。IT之家注:x86 支持雙槽雙 U 配置,因此 AMD 平臺總共有 192 核,英特爾平臺總計 112 核。
從英偉達官方數據來看,NVIDIA Grace 超級芯片總共提供了 144 個物理核心(每個芯片 72 個 Arm Neoverse V2 核心),支持 960 GB 的 LPDDR5X 內存,原始帶寬最高可達 1 TB / s,總功耗為 500W,其他規格還包括 117 MB 的 L3 緩存和 58 個 PCIe Gen5 通道。
NVIDIA 測試結果表明,Grace 在諸如 Weather WRF、MD CP2K、Climate NEMO、CFD OpenFOAM 和 Graph Analytics GapBS BFS 這些基準測試中比 AMD Genoa CPU 強約 40%,而在相同的基準測試中遙遙領先于 Intel Sapphire Rapids CPU。
不過,它在大多數場景中性能實際上與 Genoa 相當,但 AMD 兩個芯片總 TDP 達到了 640W,而 Grace Superchip 運行功耗僅有 500W。
不過,當 Grace 與 Genoa 在實際的大型數據中心應用進行比較時,性能領先幅度巨大,例如在 5 MW 測試中表現出了 2.5 倍的性能,并且效率更是遠超競品。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。