阿里云基礎設施網(wǎng)絡負責人蔡德忠在SIGCOMM2022上發(fā)表“可預期網(wǎng)絡”主題演講

始于1977年的ACM SIGCOMM是計算機網(wǎng)絡領域資歷最老的頂級學術會議,對論文的質量和數(shù)量要求極高,采用雙盲審稿,每年錄取率在10%-20%之間。被SIGCOMM錄用的論文大多數(shù)都會被廣泛引用、具有非常大的影響力,從計算機教科書里的TCP/IP網(wǎng)絡協(xié)議到云數(shù)據(jù)中心經(jīng)典架構,SIGCOMM見證了眾多計算機網(wǎng)絡關鍵技術的誕生與發(fā)展。

從2019年開始,阿里巴巴已連續(xù)4年累計16篇論文入選SIGCOMM,是國內(nèi)被收錄數(shù)量最多、質量最高的科技公司。而在2019年之前SIGCOMM近50年的歷史中,來自中國大陸的企業(yè)和高校總共也僅有10余篇論文入圍 。

本次入選的論文集中在網(wǎng)絡技術在云端場景的應用和創(chuàng)新上,比如Solar是阿里云打造的下一代高性能RDMA網(wǎng)絡協(xié)議,可將阿里云塊存儲IO延遲降低20-69%,單CPU核吞吐提升78%;Predictable uFAB是端網(wǎng)融合可預期數(shù)據(jù)中心網(wǎng)絡架構,可微秒級別保障租戶的可達性、帶寬和延遲;Meissa是大規(guī)模全覆蓋的可編程網(wǎng)絡正確性測試自動生成系統(tǒng),可將邊緣云網(wǎng)關研發(fā)測試的覆蓋率從30%提升到100%;GSO-simulcast是下一代音視頻會議全局多流碼率調度系統(tǒng),幫助視頻卡頓率降低35%,音頻卡頓率降低50%,會議滿意度提升6%;GRTN是全球音視頻傳輸網(wǎng)絡項目,提供音視頻傳輸技術的優(yōu)化和服務保障;Zhuge則是針對即時通信和音視頻應用的WiFi網(wǎng)關路由調度框架和算法。

SIGCOMM2022? Technical Session:Programmable Data Planes

“過去數(shù)據(jù)中心網(wǎng)絡的協(xié)議和架構都是為傳統(tǒng)IT workload而設計的,面對人工智能、深度學習等浪潮,網(wǎng)絡性能嚴重影響了算力集群的大規(guī)模擴展,數(shù)據(jù)中心網(wǎng)絡技術亟待變革,” 阿里云基礎設施網(wǎng)絡團隊負責人蔡德忠在大會上表示,阿里云在過去5 年大規(guī)模部署RDMA高性能網(wǎng)絡實踐基礎上,在業(yè)界首創(chuàng)了端網(wǎng)融合技術體系,并進行了一系列技術創(chuàng)新,打造了可預期網(wǎng)絡新型架構,能夠提供微妙級網(wǎng)絡延時,以及帶寬保障,高效支撐萬卡級規(guī)模GPU算力集群。

自提出做深基礎戰(zhàn)略以來,阿里云陸續(xù)推出了自研芯片、磐久服務器、交換機、光模塊、數(shù)據(jù)中心內(nèi)RDMA網(wǎng)絡等,完善云基礎設施的最后一環(huán),實現(xiàn)了以飛天操作系統(tǒng)為中心的雙向生長,從芯片、部件到整機的技術創(chuàng)新和全棧自研。今年年初,阿里巴巴還入選了AI2000評選的全球十大計算機網(wǎng)絡研究機構,緊跟麻省理工學院、斯坦福大學、微軟、谷歌等。

分享到

xiesc

相關推薦