MASK R-CNN、U-NET3D是重量級圖像目標(biāo)檢測以及圖像分割模型,其應(yīng)用場景包括自動駕駛、醫(yī)療圖像分析、監(jiān)控、工業(yè)檢測等,是典型數(shù)據(jù)中心應(yīng)用模型。而第一成績背后是每秒分析5040張X光照片、57000張圖片以及570余次訓(xùn)練迭代的,單機(jī)服務(wù)器世界極限處理速度。
MLPerf基準(zhǔn)測試在國際AI領(lǐng)域有極高影響力,其基準(zhǔn)聯(lián)盟已有谷歌、Intel、NVIDIA、微軟、Facebook等超50家成員。
新紀(jì)錄誕生
寧暢方面介紹,本次MLPerf Training V 1.0測試,共有16家國際一線廠商在固定任務(wù)(closed)賽道,提交了91個單機(jī)系統(tǒng)配置,并于DLRM、MASK R-CNN、Resnet50、SSD、U-NET3D等8個AI場景下,產(chǎn)生超百項測試成績。
MLPerf測試的AI場景包含固定任務(wù)(Closed)和開放優(yōu)化(Open)兩個賽道,固定任務(wù)(Closed)更側(cè)重公平性,參與測試的各計算系統(tǒng)基于同一套參數(shù)運行。
搭載英特爾第三代?至強(qiáng)?可擴(kuò)展處理器、Optane? BPS大容量持久內(nèi)存以及NVIDIA? A100 Tensor Core GPU的寧暢X640 G40以及X660 G45,從眾多機(jī)型配置中“殺出”,以48.43、28.64分鐘成績奪得MASK R-CNN、U-NET3D場景的單機(jī)世界性能第一,取得新世界性能紀(jì)錄。
在MASK R-CNN、U-NET3D測試中,單機(jī)服務(wù)器系統(tǒng)需要運行29GB、21GB的原始圖像數(shù)據(jù),并通過分析與迭代最終完成模型訓(xùn)練。而完成過程所耗費時間越少,則印證系統(tǒng)性能越強(qiáng)。
除獲得以上兩項性能冠軍外,在橫向比較搭載同400W功耗GPU的單機(jī)服務(wù)器系統(tǒng),寧暢X660 G45在DLRM(推薦系統(tǒng))、SSD(目標(biāo)檢測)固定任務(wù)賽道,以1.92、8.51分鐘成績?nèi)〉檬澜缧阅艿谝弧?/p>
奪冠MLPerf的唯一初創(chuàng)公司
X640 G40支持多種GPU拓?fù)浣Y(jié)構(gòu),針對不同AI場景和訓(xùn)練模型進(jìn)行互聯(lián)優(yōu)化,以滿足不同類型客戶需求。
X660 G45是專為深度學(xué)習(xí)訓(xùn)練開發(fā)的高性能計算平臺,滿配8顆GPU并采用600GB/s 的NVLink總線高速互聯(lián)。每個GPU還可搭配HDR 200Gb/s InfiniBand網(wǎng)絡(luò)和NVMe SSD高速緩存,助用戶搭建GPU高速集群。結(jié)合近500TB本地存儲容量,可極大縮短用戶AI模型訓(xùn)練時間。
本次MLPerf測試,寧暢是唯一取得冠軍成績的初創(chuàng)服務(wù)器廠商。而就在6月20日,寧暢還取得了8項SPEC CPU2017的同CPU配置服務(wù)器世界性能第一。2020年的MLPerf測試中,寧暢服務(wù)器更是打破了超10項世界性能紀(jì)錄。
對于本次奪冠,寧暢工程師介紹MLPerf測試比拼的是廠家對服務(wù)器底層硬件與軟件的理解和優(yōu)化能力,而這些“能力”來源于對用戶應(yīng)用場景的深入理解與實踐。寧暢團(tuán)隊專注服務(wù)器研發(fā)、生產(chǎn)已有15年之久,擁有近百萬臺服務(wù)器生產(chǎn)部署經(jīng)驗,可為用戶提供全棧服務(wù)器定制化服務(wù)。
作為智能算力定制專家,寧暢創(chuàng)立的2020年便已有近千家企業(yè)、用戶采購寧暢服務(wù)器產(chǎn)品,收到定制咨詢350余次,累計落地服務(wù)器定制方案170項,寧暢用戶已覆蓋互聯(lián)網(wǎng)、金融、電信等數(shù)十個行業(yè),出貨量數(shù)以萬計。
如果您對寧暢人工智能服務(wù)器感興趣,歡迎致電400-898-1688,智能算力定制專家寧暢期待為您服務(wù)。