大家好,ModelArts在多個行業(yè)和項目中有了成功落地,這離不開華為云EI在人工智能領域的長期投入。
華為云長期扎根AI基礎研究,覆蓋計算機視覺、語音語義和決策優(yōu)化三大領域。我們聚焦于模型高效、數據高效、算力高效、知識高效4大方向,提出了六大基礎研究計劃,包括面向大模型的模型摸高計劃、面向小模型的模型瘦身計劃、面向多模態(tài)學習的數據魔方計劃、面向小樣本學習的數據冰山計劃、面向通用知識抽取的萬物預視計劃和面向新學習范式的虛實合一計劃。
我們的許多研究成果,包括自動機器學習、小樣本學習、聯(lián)邦學習、預訓練模型等,能夠即插即用地部署于ModelArts使能平臺,助力AI賦能千行百業(yè)。
在多項業(yè)界公開競賽和測評中,華為云EI的持續(xù)創(chuàng)新研究已經取得了不錯的成果,這些都將應用于ModelArts平臺,提供給全球的開發(fā)者使用。
我們發(fā)布的ModelArts3.0,是面向AI在行業(yè)落地提供的AI開發(fā)平臺。在這里,我和我的團隊主要是從技術領域進行探索和研究,如何通過AI技術高效解決行業(yè)挑戰(zhàn),比如,如何用極少數據訓練出高精度模型?如何降低企業(yè)應用AI的門檻?如何解決企業(yè)對數據安全使用的顧慮等?最終,我們將骨干模型、聯(lián)邦學習、智能診斷評估優(yōu)化、和高效算力,很好的融入了ModelArts3.0,下面我將詳細解讀。
華為云骨干工具鏈EI-Backbone,整合模型高效、數據高效、算力高效、知識高效,全面提升行業(yè)AI落地能力。EI-Backbone的能力,已經在10余個行業(yè)成功驗證,并且斬獲10余個業(yè)界挑戰(zhàn)賽冠軍,發(fā)表100余篇頂級論文。EI-Backbone提供了AI開發(fā)的新范式,以肺部醫(yī)療影像分割為例來介紹:
基于EI-backbone技術,我們華為云ModelArts和杭州云深處科技有限公司合作,實現了四足機器狗的工業(yè)場景巡檢。
華為云ModelArts 3.0的下一個特性–聯(lián)邦學習。
眾所周知,數據是AI應用的基礎,只有基于多樣化的數據,才能實現AI智能感知。然而,在實際AI行業(yè)落地中,數據是分散在不同的數據控制者之間,這就導致了行業(yè)應用的數據孤島問題,使得AI算法訓練效果受到限制。
針對這個問題,華為云Modelarts提供聯(lián)邦學習特性,實現數據不出戶的聯(lián)合建模。用戶各自利用本地數據訓練,不交換數據本身,只用加密方式交換更新的模型參數,實現協(xié)同訓練。
華為云EI與中國科學院上海藥物所的蔣華良院士合作,將華為自研的FedAMP算法和AutoGenome算法應用到藥物研發(fā)的AI任務中,精準預測藥物水溶解性、心臟毒性和激酶活性,準確度遠超傳統(tǒng)的聯(lián)邦學習和深度學習算法。
此外,華為云提供云邊協(xié)同的服務,支持不同地點、不同客戶的數據進行聯(lián)邦訓練,通過加密方式上傳服務端,對全局模型進行更新,再將其下發(fā)至邊緣設備,便捷支持同業(yè)態(tài)的橫向聯(lián)邦和跨業(yè)態(tài)的縱向聯(lián)邦學習。聯(lián)邦訓練參與者可以通過云端,也可以通過華為云邊緣設備(如智能小站)的計算能力參與聯(lián)邦訓練,實現行業(yè)內聯(lián)合建模。
模型在部署上線前,需要進行充分評估,結果優(yōu)秀的模型直接投入生產環(huán)境,差強人意的則需要進一步優(yōu)化迭代。ModelArts提供了全面的可視化評估、智能化診斷功能,使得開發(fā)者可以直觀的了解模型的各方面性能,進而針對性的進行調優(yōu)或部署生產。
下面以一個上皮病變細胞分類的模型評估來進行詳細講解。
隨著深度學習分布式訓練的不斷發(fā)展,各類模型的訓練對于計算設備的需求越來越大。但由于各種原因,訓練作業(yè)的資源還沒有被充分利用。造成資源浪費的原因非常多,主要包括以下幾點:
彈性訓練是ModelArts的核心能力之一,可以根據模型訓練速度的需求自適應實現資源的最佳分配。
ModelArts提供兩種模式,一是Turbo模式,可以充分利用空閑資源加速已有訓練作業(yè),訓練速度可提升10倍以上,并且不影響模型的收斂精度;二是經濟模式,可以通過最大化資源利用率給開發(fā)者提供極致的性價比,在大多數典型場景下可以提升性價比30%以上。
為了更好地支持超大算力需求的AI研發(fā),華為ModelArts平臺在集群規(guī)模,任務數量,以及分布式訓練都做了針對性的優(yōu)化。
ModelArts研發(fā)平臺能夠管理上萬的節(jié)點,更好的支持大型訓練任務需求。通過優(yōu)化服務框架,ModelArts平臺支持10萬級別的作業(yè)同時運行、支持萬級芯片的大規(guī)模分布式任務。
優(yōu)秀的分布式加速比是大規(guī)模集群分布式訓練的關鍵能力,也是促使用戶選擇使用大規(guī)模集群來加速AI業(yè)務的關鍵因素。
華為云ModelArts領先的分布式加速比能力,在MLPerf benchmark Imagenet-1K分類任務上,使用512芯片集群跑出93.6秒的成績,優(yōu)于NVIDIA V100的120秒。
在骨干網絡、聯(lián)邦學習、模型診斷優(yōu)化、高效算力的加持下,華為云ModelArts會加速AI在行業(yè)落地。未來,華為云將持續(xù)聚焦于模型高效、數據高效、算力高效和知識高效4個重點方向,扎根于AI基礎研究。在計算機視覺、語音語義、決策優(yōu)化3大AI領域進行基礎研究計劃投入,我們會持續(xù)努力,提供強大的AI技術支持每一位開發(fā)者發(fā)揮所長、創(chuàng)造獨特價值。華為云將持續(xù)踐行普惠AI,與全球開發(fā)者共成長!
謝謝大家!