目前,業(yè)界主流的自動(dòng)駕駛方案需要融合圖像、激光雷達(dá)、毫米波雷達(dá)、GPS等多個(gè)模態(tài)數(shù)據(jù),但大規(guī)模訓(xùn)練樣本數(shù)據(jù)加載和預(yù)處理的效率較低,導(dǎo)致GPU資源浪費(fèi);同時(shí),自動(dòng)駕駛模型算子數(shù)量巨大,使用現(xiàn)有訓(xùn)推框架系統(tǒng)執(zhí)行效率低下,且優(yōu)化門檻高。

阿里云推出的PAI-TurboX,在多模態(tài)數(shù)據(jù)預(yù)處理、離線大規(guī)模模型訓(xùn)練以及實(shí)時(shí)智駕推理等環(huán)節(jié)提供了全面解決方案。在系統(tǒng)側(cè),PAI-TurboX通過(guò)優(yōu)化CPU親和性、動(dòng)態(tài)編譯、流水線并行等策略,顯著提升模型的訓(xùn)練推理效率;在數(shù)據(jù)側(cè),PAI-TurboX提出了高性能的DataLoader引擎,并且優(yōu)化了數(shù)據(jù)預(yù)處理流程和實(shí)現(xiàn)了智能訓(xùn)練樣本分組,有效提升數(shù)據(jù)處理效率。

此外,PAI-TurboX還提供了算子優(yōu)化和量化等能力,可進(jìn)一步減少訓(xùn)練階段的訪存延遲,提升吞吐效率,同時(shí)在推理任務(wù)中,能在保障精度的同時(shí)降低計(jì)算開銷與內(nèi)存帶寬需求,可實(shí)現(xiàn)異構(gòu)平臺(tái)下的高性能推理部署。

實(shí)測(cè)結(jié)果顯示,在自動(dòng)駕駛的3D物體檢測(cè)模型BEVFusion訓(xùn)練任務(wù)中,PAI-TurboX可以將訓(xùn)練時(shí)間縮短58.5%;在實(shí)時(shí)在線矢量化高精地圖構(gòu)建模型MapTR訓(xùn)練任務(wù)中,PAI-TurboX可以將訓(xùn)練時(shí)間縮短53%;在端到端自動(dòng)駕駛模型SparseDrive訓(xùn)練任務(wù)中,PAI-TurboX 可以在感知模塊訓(xùn)練和聯(lián)合訓(xùn)練兩個(gè)階段獲得明顯的速度提升,相同訓(xùn)練步數(shù)下可分別縮短51.5%和48.5%。

阿里云研究員林偉表示:“ TurboX不僅可以提升自動(dòng)駕駛模型的訓(xùn)推效率,還將進(jìn)一步加速世界模型的開發(fā)進(jìn)程,讓所有終端和人一樣具備感知、思考和決策能力?!?/p>

據(jù)介紹,阿里云人工智能平臺(tái)PAI可提供貫穿AI開發(fā)和運(yùn)維全流程的平臺(tái)服務(wù)。自2016年誕生以來(lái),PAI已累計(jì)服務(wù)超過(guò)10萬(wàn)家企業(yè)客戶及數(shù)百萬(wàn)AI開發(fā)者,支撐阿里云百煉、魔搭社區(qū)等MaaS服務(wù)及社區(qū)。

分享到

xiesc

相關(guān)推薦