NVIDIA Quantum-2搭載第三代NVIDIA SHARP技術(shù),能夠為各種規(guī)模的網(wǎng)絡(luò)數(shù)據(jù)聚合創(chuàng)造幾乎無限的可擴展性,其AI加速能力將達(dá)至前一代的32倍。此外,第三代SHARP技術(shù)可在不降低性能的情況下,支持多個租戶或多個并行應(yīng)用共享基礎(chǔ)設(shè)施。MPI_Alltoall加速和MPI標(biāo)簽匹配硬件引擎以及其他功能(如高級擁塞控制、動態(tài)路由以及自我修復(fù)網(wǎng)絡(luò))可為高性能計算(HPC)和AI集群提供至關(guān)重要的增強功能,從而使其性能更上一層樓。

df0da56a5db41bb5e63a873b78e21acd.png

ConnectX-7 HCA網(wǎng)卡

NVIDIA ConnectX@-7 InfiniBand網(wǎng)卡(HCA) ASIC可提供400Gb/s的數(shù)據(jù)吞吐量,并支持16通道的PCle5.0或PCle4.0主機接口。400Gb/s lnfiniBand采用先進的每通道100Gb/s的SerDes,通過交換機和HCA端口上的OSFP連接器實現(xiàn)物理連接。每個交換機OSFP連接器支持兩個400Gb/s InfiniBand端口或200Gb/s InfiniBand端口。網(wǎng)卡HCA的OSFP連接器支持一個400Gb/s InfiniBand端口。400Gb/s線纜產(chǎn)品包括有源及無源銅纜、收發(fā)器以及MPO光纜。需要注意的是,雖然網(wǎng)卡與交換機都采用的OSFP封裝,但在物理尺寸上有所區(qū)別:交換機端的OSFP模塊帶散熱鰭片,而網(wǎng)卡端采用OSFP-RHS結(jié)構(gòu)不帶散熱片,依靠網(wǎng)卡端口上的散熱片輔助模塊進行散熱。

694d7999064f0d43158389a7733d4b90.png

NDR光連接解決方案

超擎數(shù)智提供靈活的NDR光連接解決方案,NDR交換機端口的物理形態(tài)是OSFP,每個接口有八個通道,每通道采用100Gb/s的SerDes;所以從連接速率上來看,有800G to 800G、800G to 2X400G與800G to 4X200G三種主流連接方案;同時,每個通道支持從100Gb/s降至50Gb/s,所以它也可以與上一代HDR(HDR采用50Gb/s的SerDes)設(shè)備互連,即可以支持400G to 2X200G。

NDR系列電纜和收發(fā)器提供了豐富的產(chǎn)品選擇,用于配置任何網(wǎng)絡(luò)交換和適配器系統(tǒng),專注于長達(dá) 2 公里的數(shù)據(jù)中心長度,用于加速人工智能計算系統(tǒng)。為了最大限度地減少數(shù)據(jù)重傳,電纜和收發(fā)器都具有低延遲、高帶寬人工智能和加速計算應(yīng)用所需的極低誤碼率 (BER)。

從連接件類型上來看,主要有三種方式:無源銅纜DAC、有源銅纜ACC與光模塊+跳線的方案。其中DAC支持1-3米的傳輸距離(其中直連DAC傳輸距離為2米),ACC支持3-5米的傳輸距離,多模光模塊最遠(yuǎn)支持50米傳輸距離,單模光模塊最遠(yuǎn)支持500米傳輸距離。

bdffa75f0b6d70ab99ae715cbac8f28c.png


超擎數(shù)智NDR交換機到NDR設(shè)備連接方案

NDR InfiniBand Quantum-2交換機 —— NDR InfiniBand Quantum-2交換機

1、NDR光模塊

多模光模塊——MMA4Z00-NS(50m)

單模光模塊——MMS4X00-NS(100m)、MS4X00-NM(500m)

① Single 2x400Gb/s OSFP – Single 2x400Gb/s OSFP:使用OSFP雙端口收發(fā)器和兩根直連MPO-12/APC光纖跳線以 800G (2x400G) 速率將兩臺OSFP端口的 QM9700/QM9790交換機連接在一起,多模最遠(yuǎn)傳輸距離可以達(dá)到50m,單模傳輸距離可以達(dá)到100m或500m;

② Single 2x400Gb/s OSFP – Dual 2x400Gb/s OSFP:使用OSFP雙端口收發(fā)器和兩根MPO-12/APC光纖跳線還可以路由到兩個不同的交換機,形成兩條 400Gb/s 鏈路,然后將額外的OSFP端口路由到更多的交換機。

d6060631e40c4e9ed203bdc1173cd881.png

800G SR8連接示意圖

0ec536598623738c11922a2e91d6c5a8.png

800G DR8 100m連接示意圖

b8dd66bd8284937628c5954c398e03aa.png

800G DR8 500m連接示意圖

2、NDR Copper(DAC / ACC)

NDR Copper Cable的主要用途是將兩個雙端口、基于 OSFP 的 Quantum-2 InfiniBand 或 Spectrum-4 以太網(wǎng)交換機相互連接在一起,分為無源銅纜DAC和有源銅纜ACC,其中平頂Flat Top用于 DGX H800,翅片頂部Finned Top連接器用于 InfiniBand 或以太網(wǎng)交換機。

-MCP4Y10:無源銅纜(DAC),長度最長2m。

-MCA4J80:有源銅纜 (ACC),可將長度延長至 3、4 和 5 米,同時保持每端 1.5 瓦的極低延遲和極低功耗。

742dd09b4d9e29e6b9b75af705f53b14.png

800G DAC連接示意圖

90dca25e3c6340baf4fa2f26504bf063.png

800G ACC連接示意圖

NDR InfiniBand Quantum-2交換機 —— 2 x 400G ConnectX-7(OSFP/QSFP112)Adapter/BlueField-3 DPU(QSFP112)

1、NDR光模塊

交換機側(cè):800G Twin-port OSFP光模塊——MMA4Z00-NS(50m)、MMS4X00-NS(100m)

網(wǎng)卡側(cè):400G Single port OSFP/QSFP112光模塊——MMA4Z00-NS400 / MMA1Z00-NS400(50m)、MMS4X00-NS400(100m)

使用兩根光纖跳線的雙端口 OSFP 光模塊最多可支持兩個適配器和/或 DPU 組合。兩條 4 通道光纖跳線中的每一條都可以連接到 OSFP 或 QSFP112 封裝的 400G 光模塊,多模最遠(yuǎn)傳輸距離可達(dá) 50 米,單模最遠(yuǎn)傳輸距離可達(dá)100m。

-僅 ConnectX-7/OSFP 支持單端口 OSFP。

-QSFP112封裝光模塊可用于ConnectX-7/QSFP112和BlueField-3/QSFP112 DPU。

-使用 OSFP 或 QSFP112 的 ConnectX-7 和 BlueField-3 的任意組合可同時與雙端口 OSFP 光模塊連接使用。

3c39b547356620b4b9f0771229954e0b.png

800G SR8 —— 2x400G SR4連接示意圖

ca94e60551a30e5cf7f757a9906d4230.png

800G DR8 —— 2x400G DR4連接示意圖

2、NDR Copper(DAC/ACC)

800Gb/s 雙端口 OSFP至 2x400Gb/s OSFP/QSFP112 分支銅纜適用于 400Gb/s NVIDIA 端到端 Infiniband和以太網(wǎng)解決方案。主要用途是將 800Gb/s Quantum-2 交換機或 Spectrum-4 交換機連接到基于 OSFP/QSFP112 的 400Gb/s ConnectX-7 PCIe 網(wǎng)絡(luò)適配器卡/BlueField-3 DPU。

-單端口 OSFP僅適用于 ConnectX-7/OSFP 網(wǎng)絡(luò)適配器。

-BlueField-3/QSFP112 DPU 和 ConnectX-7/QSFP112 適配器需要 MCP7Y10 和 MCA7J65 銅纜上的 QSFP112 端。

-有源銅纜 (ACC) MCA7J60、MCA7J65的長度可提供 4 米和 5 米。

a81b944a62aec3256d30c87d1e1e38d0.png

OSFP – 2x400G OSFP DAC/ACC連接示意圖

d7de3e4b40e0756c0f6e94e85064a310.png

OSFP – 2x400G QSFP112 DAC連接示意圖

NDR InfiniBand Quantum-2交換機 —— 4 x 200G ConnectX-7(OSFP/QSFP112)Adapter/BlueField-3 DPU(QSFP112)

1、NDR Twin-port光模塊

交換機側(cè):800G Twin-port OSFP光模塊——MMA4Z00-NS(50m)、MMS4X00-NS(100m)

網(wǎng)卡側(cè):400G Single port OSFP/QSFP112光模塊——MMA4Z00-NS400 / MMA1Z00-NS400(50m)、MMS4X00-NS400(100m)

使用兩根 1:2 分支光纖跳線的雙端口 OSFP 光模塊最多可支持四個適配器和/或 DPU 組合。兩根 4 通道 1:2 分支光纖跳線中的每根都可以連接到 OSFP 或 QSFP112 封裝的 400G 光模塊,最遠(yuǎn)傳輸距離可達(dá) 50 米。在 400G 光模塊中僅激活其中的兩個通道,從而實現(xiàn) 200G 應(yīng)用。

-僅 ConnectX-7/OSFP 支持單端口 OSFP。

-QSFP112 封裝光模塊可用于 ConnectX-7/QSFP112 和BlueField-3/QSFP112 DPU。

-ConnectX-7 和 BlueField-3 網(wǎng)卡的任意組合可同時與雙端口OSFP 光模塊連接使用。

-單模直連光纖最大傳輸距離為 100 米,但 1:2 分支光纖跳線的最大傳輸距離為 50 米。

c15999bf2bda81bcadd43b5e15978926.png

800G SR8 —— 4x200G SR2連接示意圖

1803cafc67bb63500637c6eb5aeb8e48.png

800G DR8 —— 4x200G DR2連接示意圖

2、NDR Copper(DAC/ ACC)

800Gb/s 雙端口 OSFP至 4x200Gb/s OSFP/QSFP112 分支銅纜適用于 400Gb/s NVIDIA 端到端 Infiniband和以太網(wǎng)解決方案。主要用途是將 800Gb/s Quantum-2 交換機或 Spectrum-4 交換機連接到基于 OSFP/QSFP112 的 200Gb/s ConnectX-7 PCIe 網(wǎng)絡(luò)適配器卡/BlueField-3 DPU。

-單端口 OSFP僅適用于 ConnectX-7/OSFP 網(wǎng)絡(luò)適配器。

-BlueField-3/QSFP112 DPU 和 ConnectX-7/QSFP112 適配器需要 MCP7Y40 和 MCA7J75銅纜上的 QSFP112 端。

-有源銅纜 (ACC) MCA7J70、MCA7J75的長度可提供 4 米和 5 米。

0c02364bf2f02630f9789ea287d8cace.png

OSFP – 4x200G OSFP DAC/ACC連接示意圖

ea3759b27c4fb6f46250c51a418b42c8.png

OSFP – 4x200G QSFP112 DAC連接示意圖

NDR InfiniBand Quantum-2交換機 —— DGX H800 GPU Systems

1、NDR光模塊

DGX-H800 在頂部機箱部分包含 8 個“Hopper”H800 GPU,在底部服務(wù)器部分包含兩個 CPU、存儲以及 InfiniBand 和/或以太網(wǎng)網(wǎng)絡(luò)設(shè)備。其中包含八個 400Gb/s ConnectX-7 IC,安裝在兩個稱為“Cedar-7”板卡的夾層板上,用于 GPU 到 GPU InfiniBand 或以太網(wǎng)網(wǎng)絡(luò)。板卡 I/O 在內(nèi)部路由至四個 800G 雙端口 OSFP 機箱,內(nèi)置散熱器安裝于前面板上的機箱頂部。這需要在 DGX H800 中使用flat-top transceivers、ACC 和 DAC 線纜。由于交換機中的氣流入口減少,400G IB/EN 交換機需要使用finned-top 2x400G 光模塊進行額外冷卻。

每個雙端口 2x400G 光模塊提供兩條從 DGX 到 Quantum-2 或 Spectrum-4 交換機的 400G ConnectX-7 鏈路。與 DGX A800 相比,這減少了 ConnectX-7 板卡冗余、復(fù)雜性和光模塊數(shù)量,DGX A800 使用 8 個獨立的 HCA 和 8 個光模塊或 AOC 線纜以及兩個用于 InfiniBand 或以太網(wǎng)存儲的附加 ConnectX-6。

此外,對于存儲、集群和管理的傳統(tǒng)網(wǎng)絡(luò),DGX-H800 還支持多達(dá)四個 ConnectX-7 和/或兩個 BlueField-3 DPU 在 InfiniBand 和/或以太網(wǎng)中用于存儲 I/O,以及支持使用 OSFP 或 QSFP112 光模塊的 400G 或 200G 設(shè)備進行的額外網(wǎng)絡(luò)。這些 PCIe 卡槽位于OSFP GPU機箱的兩側(cè),并使用單獨的電纜和/或光模塊。

19b790324c0432eba3704d9ef13d0ce7.png

800G SR8連接示意圖

b1fe85539a8cfcc2551e499eb24710c4.png

800G DR8連接示意圖

2、NDR Copper(DAC/ ACC)

OSFP 平頂端Flat Top線纜可用于液冷交換機和 DGX H800 系統(tǒng),其中,MCP4Y10-N0XX-FLT無源DAC電纜長度為0.5m和1m,MCA4J80有源ACC電纜連接到DGX-H800 Cedar 系統(tǒng)可使用的長度為3m。

415029ca998f4029ea5e285791be5b2f.png

800G DAC連接示意圖

2c54e7f6f846cc22656c0266f63b7b77.png

800G ACC連接示意圖

超擎數(shù)智NDR交換機到HDR設(shè)備連接方案

NDR InfiniBand Quantum-2交換機 —— 2 x HDR InfiniBand Quantum交換機

NDR InfiniBand Quantum-2交換機 —— 2 x 200G QSFP56 ConnectX-6 Adapter/BlueField-2 DPU

MFA7U10-H00X是一款 OSFP 至 2x QSFP56、400Gb/s 至 2 x 200Gb/s 有源分光器電纜 (AOC),將來自單個 OSFP 端上的 8 個 MMF(多模光纖)對中的每對數(shù)據(jù)信號連接到每個 QSFP56 多端口端的四對。MFA7U10-H00X用于將帶有 OSFP 端口的 NDR 交換機連接到基于QSFP56 端口的2 個HDR 交換機或ConnectX-6適配器/BlueField-2 DPU 。

381fa0ace6fe5670776757fa9408fe5e.png

400G OSFP – 2x200G QSFP56 AOC線纜連接示意圖

分享到

songjy

相關(guān)推薦