自2013年首次舉辦,大賽就吸引了來(lái)自全國(guó)各地的20余家高校報(bào)名參加。在2016年舉辦第四屆大賽時(shí),更是吸引了近60支高校隊(duì)伍參賽,并受到了來(lái)自國(guó)際頂尖高性能計(jì)算、云計(jì)算和大數(shù)據(jù)領(lǐng)域?qū)<业膹V泛關(guān)注和媒體的爭(zhēng)相報(bào)道。
第五屆RDMA編程大賽由HPC Advisory Council(國(guó)際高性能計(jì)算咨詢委員會(huì))主辦,并獲得了包括阿拉貢國(guó)家實(shí)驗(yàn)室、圣地亞哥超算中心、中國(guó)高性能計(jì)算委員、China Grid、京東、科大訊飛、曠視科技、Mellanox、Nvdia、SenseTime等國(guó)內(nèi)外多家知名機(jī)構(gòu)及明星企業(yè)的大力支持。大賽評(píng)委由來(lái)自于國(guó)內(nèi)外人工智能領(lǐng)域編程專家組成。
基本上,一年一度的RDMA編程挑戰(zhàn)賽都在夏天剛露頭的5月份舉辦,這可以說(shuō)是為解決數(shù)據(jù)的燥熱問(wèn)題的帶來(lái)的一股強(qiáng)有力的涼氣。別忘了,目前數(shù)據(jù)“熱”得十足“若火龍”了——移動(dòng)互聯(lián)、大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)等概念與實(shí)踐在商業(yè)與社會(huì)領(lǐng)域的態(tài)勢(shì),把數(shù)據(jù)的重要性推到了前所未有的高度。這讓在數(shù)據(jù)處理上有著先天優(yōu)勢(shì)的AI、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)分析等圍繞海量、異構(gòu)數(shù)據(jù)問(wèn)題的處理技術(shù)變得炙手可熱。
HPC Advisory Council亞太區(qū)主席劉通
但問(wèn)題是,火了的數(shù)據(jù)卻讓傳統(tǒng)數(shù)據(jù)傳輸網(wǎng)絡(luò)也“火”。不過(guò),后一個(gè)“火”有些發(fā)火的意思。因?yàn)?,在傳統(tǒng)數(shù)據(jù)傳輸網(wǎng)絡(luò)技術(shù)下,CPU面對(duì)著前所未有的海量數(shù)據(jù)涌入已經(jīng)有些招架不住了,正所謂“雙拳難敵四手”,多核架不住又著急又無(wú)休止的數(shù)據(jù)交互。TCP/IP網(wǎng)絡(luò)惹的禍,延遲、丟包等問(wèn)題,CPU還要跟著背鍋。正如劉通所講,“雖說(shuō)目前計(jì)算機(jī)單核計(jì)算能力已經(jīng)很強(qiáng)大了,但是新的計(jì)算技術(shù)需求更加偏向集群技術(shù)。為此,CPU處理能力的負(fù)擔(dān)就會(huì)向網(wǎng)絡(luò)端轉(zhuǎn)移?!睘榇薘DMA技術(shù)就是來(lái)解決因高速數(shù)據(jù)處理需求時(shí),CPU、TCP/IP網(wǎng)絡(luò)到時(shí)真的“日車不動(dòng)”的尷尬。
RDMA中文名遠(yuǎn)程直接內(nèi)存訪問(wèn),該技術(shù)允許網(wǎng)絡(luò)中的計(jì)算機(jī)直接從內(nèi)存里交換數(shù)據(jù),從而省卻了通知CPU、高速緩存或者OS,數(shù)據(jù)從網(wǎng)卡處直接寫入內(nèi)存,比起傳統(tǒng)網(wǎng)絡(luò)數(shù)據(jù)傳輸能顯著提升性能和效率。為此,該技術(shù)在HPC、云計(jì)算、大數(shù)據(jù)、數(shù)據(jù)庫(kù)和高頻交易等領(lǐng)域擁有越來(lái)越廣泛的應(yīng)用前景。例如,谷歌、百度、阿里、京東、科大訊飛、商湯科技、Face++這些搞深度學(xué)習(xí)或是AI的重度用戶,無(wú)不是RDMA技術(shù)的擁躉。從去年的大學(xué)生RDMA編程挑戰(zhàn)賽上,就可看到評(píng)委席上越來(lái)越多有著他們的身影,今年亦如此。
RDMA雖好,但是“樹難栽”?!叭缃?,RDMA遇到的最大的問(wèn)題是其人才供應(yīng)問(wèn)題。我們已經(jīng)有了很先進(jìn)的HPC、深度學(xué)習(xí)硬件設(shè)備,但是在相應(yīng)的軟件供應(yīng)上存在比較大的鴻溝,缺少RDMA人才培養(yǎng)重點(diǎn)方向的有效指引以及對(duì)人才培養(yǎng)重要性的認(rèn)識(shí)。從HPC Advisory Council來(lái)說(shuō),我們與國(guó)外研究聯(lián)系比較緊密,發(fā)現(xiàn)RDMA的軟件創(chuàng)新前沿更多聚焦在國(guó)外研究。為此,通過(guò)這種競(jìng)賽,將國(guó)外先進(jìn)技術(shù)引入國(guó)內(nèi)高校,促進(jìn)國(guó)內(nèi)RDMA人才的培養(yǎng)?!眲⑼ㄖv。
此外,劉通指出,每年競(jìng)賽都會(huì)指定一款軟件做RDMA的開發(fā),去年是Tensorflow,今年指定的是MXNET?!癕XNET是中國(guó)出去的優(yōu)秀的開發(fā)人員研發(fā)的,是非常優(yōu)秀的并行通訊框架。國(guó)外和很多公司和實(shí)驗(yàn)室已經(jīng)給予了MXNET很多高度評(píng)價(jià)。但是,MXNET在GPU與CPU之間計(jì)算操作上內(nèi)存的拷貝很繁瑣,有了RDMA可以直接省卻這步。同時(shí),其并行通訊框架只能支持TCP/IP。為此,希望中國(guó)學(xué)子將會(huì)在MXNET里面進(jìn)一步做優(yōu)化,從而讓中國(guó)學(xué)子開發(fā)出的軟件有更好的認(rèn)可?!眲⑼ń忉?。
國(guó)際高性能計(jì)算咨詢委員會(huì)第五屆大學(xué)生RDMA變成競(jìng)賽歡迎全球各大高校的學(xué)生參賽(個(gè)人或團(tuán)隊(duì)形式)。本屆大賽即日啟動(dòng),并計(jì)劃于HPC Advisory Council中國(guó)研討會(huì)期間(10月18日)舉行頒獎(jiǎng)典禮。美國(guó)知名高校教授與專家講現(xiàn)場(chǎng)頒獎(jiǎng)并會(huì)向表現(xiàn)優(yōu)秀學(xué)生伸出入讀美國(guó)名校的橄欖枝,參賽學(xué)生也將成為企業(yè)競(jìng)相爭(zhēng)取的人才。
在上屆比賽中,國(guó)防科技大學(xué)和華中科技大學(xué)憑借出色的成績(jī)獲得了一等獎(jiǎng),來(lái)自中國(guó)科技大學(xué)和西安電子科技大學(xué)1隊(duì)的參賽選手奪得二等獎(jiǎng),西安電子科技大學(xué)2隊(duì)、西北工業(yè)大學(xué)、中國(guó)海洋大學(xué)和南京大學(xué)獲得了三等獎(jiǎng)。
獲勝隊(duì)伍學(xué)生和導(dǎo)師將會(huì)接受媒體采訪,并且有機(jī)會(huì)參加HPC Advisory Council在其他國(guó)家舉辦的國(guó)際研討會(huì)分享成果。領(lǐng)隊(duì)導(dǎo)師也有機(jī)會(huì)通過(guò)比賽發(fā)現(xiàn)新的研究方向,加強(qiáng)國(guó)際合作。我們期待今年會(huì)有更多院校參賽,并取得理想成績(jī)。
獎(jiǎng)項(xiàng)設(shè)置(人民幣):
特等獎(jiǎng)1名:獎(jiǎng)金5萬(wàn)元
一等獎(jiǎng)2名:獎(jiǎng)金各3萬(wàn)元
二等獎(jiǎng)2名:獎(jiǎng)金各1萬(wàn)元
三等獎(jiǎng)4名:獎(jiǎng)金各5千元
參賽人員:每支參賽隊(duì)伍由一名導(dǎo)師及1至5名參賽隊(duì)員組成(本科或在讀研究生)
注冊(cè)方式:發(fā)送Email到rdma@rdmaworld.com或rdma@hpcadvisorycouncil.com ,注明參賽人員姓名、就讀院校與專業(yè)、年級(jí)、聯(lián)系方式、有無(wú)InfiniBand計(jì)算集群、指導(dǎo)老師。我們將會(huì)提供比賽試,注明參賽人員姓名、就讀院校與專業(yè)、年級(jí)、聯(lián)系方式、有無(wú)InfiniBand計(jì)算集群、指導(dǎo)老師。我們將會(huì)提供比賽試題以及培訓(xùn)資料,并將根據(jù)報(bào)名情況組織區(qū)域性培訓(xùn)。
比賽規(guī)則:
1、 組委會(huì)收到各自申請(qǐng)后隨即提供比賽源程序及培訓(xùn)資料
2、 應(yīng)用程序需在擁有RDMA能力的網(wǎng)絡(luò)環(huán)境中運(yùn)行(如InfiniBand),運(yùn)行節(jié)點(diǎn)數(shù)與配置根據(jù)本校集群條件決定。如參賽隊(duì)不具備RDMA環(huán)境,組委將會(huì)提供相應(yīng)運(yùn)行環(huán)境。
3、 參賽人員提交移植的應(yīng)用程序源代碼與執(zhí)行文件,并提交詳細(xì)報(bào)告說(shuō)明改動(dòng)前后的實(shí)際運(yùn)行性能差異對(duì)比,并作出性能提升的解釋(英文報(bào)告)
4、 評(píng)審委員會(huì)審查源程序及報(bào)告,并安排遠(yuǎn)程或面對(duì)面的答辯,最終決定優(yōu)勢(shì)者
5、 比賽結(jié)果將在HPC Advisory Council中國(guó)研討會(huì)上頒布(10月18日,合肥) ,本次會(huì)議是中國(guó)最大的國(guó)際高性能計(jì)算大會(huì)之一。大會(huì)屆時(shí)將邀請(qǐng)多位國(guó)外知名專家為獲勝者頒獎(jiǎng)
大賽評(píng)審委員會(huì)
主席
Pavan Balaji, Argonne National Lab
評(píng)審委員
Gilad Shainer, HPC Advisory Council Chairman
Tong Liu, HPC Advisory Council Asia Chair
Pak Lui, HPC Advisory Council HPC Works Special Interest Group Chair
Tarick Bedeir, HPC Advisory Council Programming Advisor
Zhijiang Zhang, iFLYTEK
Dennis Weng, JD. Com Inc.
Wenbin Tang,CTO of Face++(Megvii)
Rich Graham, MPI Forum Chair
Dr. Sreeram Potluri, NVIDIA
Davide Rossetti, NVIDIA
Tatineni Mahidhar,HPC System Manager, San Diego Supercomputer Center
Shengen Yan, SenseTime
預(yù)告:
由DOIT/Dostor聯(lián)合中國(guó)計(jì)算機(jī)學(xué)會(huì)存儲(chǔ)專委會(huì)聯(lián)合舉辦的第四屆中國(guó)閃存峰會(huì),今年6月舉行,會(huì)議現(xiàn)在已經(jīng)開放注冊(cè)(http://cff.dostor.com/index_app.html)。本次峰會(huì)將從NAND顆粒制造、閃存控制器、SSD、NVMe、全閃存陣列、分布式閃存存儲(chǔ)、軟件定義存儲(chǔ)、超融合、數(shù)據(jù)庫(kù)、大數(shù)據(jù)應(yīng)用多個(gè)角度,探討閃存技術(shù)和應(yīng)用,歡迎各界人士蒞臨。