“身外身法“還有一個我們都熟悉的名字,那就是“分身術(shù)”。

乍看之下,分身術(shù)屬于《西游記》當(dāng)中比較初級的法術(shù),不少有個名號的小妖都能比劃兩下。但在另一方面,能夠像孫悟空一樣運用到嘆為觀止的地步,那可就不多嘍。

正因如此,把“達芬奇架構(gòu)”排在華為十大嚇人技術(shù)之首。簡單來說,達芬奇架構(gòu)確實稱得上是超強分身術(shù),屬于華為AI芯片的“秘密武器”。

這個面向AI的全新計算架構(gòu),具備高算力、高能效、靈活可裁剪的特性。它集成了向量、標(biāo)量、硬件加速器等多種計算單元。同時支持多種精度計算,支撐訓(xùn)練和推理兩種場景的數(shù)據(jù)精度要求,實現(xiàn)AI的全場景需求覆蓋。

基于自研的達芬奇架構(gòu),華為推出了目前單芯片計算密度最大的芯片昇騰910以及主打高效計算低功耗AI芯片昇騰310,和Atlas人工智能計算平臺,系列產(chǎn)品可用于公共安全、運營商、金融等行業(yè)。比如,Atlas 200 AI加速模塊可以用于攝像頭、無人機等終端,半張信用卡大小就可以支持16路高清視頻實時分析。

實際上,之所以要自研達芬奇架構(gòu),是因為華為預(yù)測2025年全球智能終端將會達到400億臺,智能助理的普及率將達到90%。舉個最簡單的例子:在那個時代,憑借強大的AI與先進的無人檢測設(shè)備輔助,“求醫(yī)問藥”的形態(tài)將會完全改變——

“專家一號難求”的掛號擠破頭乃至猖獗的黃牛號販子將不復(fù)存在,取而代之的是通過個人終端完成的自助式體檢,以及快捷高效的對癥下藥。

既無需為頭痛腦熱而遠赴醫(yī)院問診,看似無關(guān)痛癢的小病小災(zāi)背后潛藏的病灶也能被及時揪出來,效率與準(zhǔn)確度皆有極大提升。

除了醫(yī)療行業(yè)外,自動駕駛、人臉識別等多種AI細分場景都對算力有著極高的要求,而達芬奇架構(gòu)正能提供強勁算力。據(jù)說,華為內(nèi)部用“算力無窮無盡”來描述,無窮無盡,可不就像孫大圣拔一把毫毛,吹出數(shù)不盡的“大圣”嘛!

七十二變——A-Tune智能調(diào)優(yōu)技術(shù)

要說孫悟空最廣為人知的技能,那不用多說,肯定就是七十二般變化了:大可變做平地而起的高山,小可變身桌上水果盤的一粒葡萄,不管是看上去多難纏的妖孽,有了七十二變撐腰,孫行者總能化險為夷,找到破解的訣竅。

傳統(tǒng)的操作系統(tǒng),為上層應(yīng)用提供通用機制來管理硬件資源并進行資源調(diào)度,但在現(xiàn)實世界中,豐富的應(yīng)用千差萬別,對于資源的需求也各不相同,每個具體應(yīng)用往往需要依賴程序員的個人經(jīng)驗進行手工調(diào)優(yōu),效果難以保證。

而開發(fā)者擁有A-Tune智能調(diào)優(yōu)技術(shù),就像是有了滿足上層應(yīng)用自動進行資源調(diào)優(yōu)的法門,換句話說,A-Tune智能調(diào)優(yōu)技術(shù)能夠針對具體的業(yè)務(wù)場景進行定制,讓操作系統(tǒng)更“懂”業(yè)務(wù)場景,給出最合適的資源模型,著實千變?nèi)f化,滿足從初學(xué)者到高階開發(fā)者的各種各樣的需求,最終達到應(yīng)用性能加速的目標(biāo)。

換言之,A-Tune技術(shù)能完全滿足入門到專業(yè)級開發(fā)者的不同需求:

1).對于初學(xué)者來說,盡可能屏蔽華為鯤鵬硬件和OS的底層細節(jié),降低開發(fā)者的準(zhǔn)入門檻;

2).對于高階開發(fā)者來說,可以針對具體的業(yè)務(wù)場景進行定制,比如豐富經(jīng)驗庫,訓(xùn)練自己的模型,實現(xiàn)更細粒度的調(diào)優(yōu)。

總的來說,A-Tune技術(shù)能把應(yīng)用&系統(tǒng)性能做到最優(yōu),從而總體上降低成本,比如以前你可能需要購買10臺服務(wù)器才能實現(xiàn)的工作,現(xiàn)在可能需要7-8臺服務(wù)器就夠?qū)崿F(xiàn)工作了。這對于人力資源有限的中小型企業(yè)的開發(fā)者來說意味著什么,應(yīng)該已經(jīng)無需過多強調(diào)了吧?

基于A-Tune技術(shù)構(gòu)建的華為自研操作系統(tǒng)openEuler,就體現(xiàn)出了高安全性、高可擴展性、高性能等優(yōu)勢特點。

定心真言——S2S自動微分

老母道:“東邊不遠,就是我家,想必往我家去了。我那里還有一篇咒兒,喚做定心真言,又名做緊箍兒咒。你可暗暗念熟,牢記心頭,再莫泄漏一人知道。我去趕上他,叫他還來跟你,你卻將此衣帽與他穿戴。他若不服你使喚,你就默念此咒,他再不敢行兇,也再不敢去了?!比芈勓?低頭拜謝。

——《西游記》第十四回,“心猿歸正 六賊無蹤”

“定心真言”,也就是我們都不陌生的“緊箍咒”。

“緊箍咒”雖然簡單,卻有無窮威力,縱使孫悟空那樣的潑猴,也被唐僧的幾句咒語制得服服帖帖。而在華為的一眾嚇人技術(shù)中,最符合這個法術(shù)調(diào)性的無疑便是S2S自動微分了。

了解編程的同學(xué)都知道,業(yè)界框架實現(xiàn)的自動微分根據(jù)實現(xiàn)原理不同,自動微分可以分為3種:

以Google的TensorFlow為代表的圖方法,Facebook的PyTorch為代表的運算符重載,和華為自研的MindSpore為代表的源碼轉(zhuǎn)化方法(Source To Source,S2S)。

在華為自研的全場景AI計算框架MindSpore中的自動微分就采用S2S形式,憑借可編程性強(原生python表達+IR級可微分)、優(yōu)化效率高(豐富的編譯優(yōu)化手段+反向算子自動調(diào)優(yōu))以及豐富調(diào)試手段(可視化+動態(tài)執(zhí)行)這三大特點備受開發(fā)者的喜愛,值得一提的是,在MindSpore中開發(fā)者能夠用原生Python實現(xiàn)AI算法,另外還可使用可視化接口觀察程序運行狀態(tài),可謂是讓開發(fā)者輕松上手AI開發(fā)。

尤其對像唐僧那樣的小白、入門級開發(fā)者來說,如何更高效地完成AI算子開發(fā),應(yīng)該不用我更多解釋了吧?

筋斗云——分布式深度學(xué)習(xí)技術(shù)

喜歡看孫悟空拜訪菩提祖師學(xué)技能的小伙伴們應(yīng)該還記得,從最開始的稍離地面,到能飛在山谷中,再到可以連續(xù)幾個筋斗直沖天庭,雖經(jīng)歷了較長一段時間的學(xué)習(xí),但功夫不負有心人,最終達成的效果也是有目共睹。

而在互聯(lián)網(wǎng)通信技術(shù)不斷發(fā)展的今天,我們無時無刻都能感受到信息傳遞速度帶來的影響:

從撥號通話都要祈禱模擬信號連接穩(wěn)定不會串號的1G,到從模擬進入數(shù)字時代可以發(fā)送短信的2G,到正式接入互聯(lián)網(wǎng)可以看圖的3G,再到視頻流媒體徹底改變移動互聯(lián)定義的4G,乃至潛力無窮無盡難以想象應(yīng)用極限的5G,隨著每一代移動互聯(lián)網(wǎng)技術(shù)的發(fā)展進化,每一輪網(wǎng)絡(luò)傳輸效率的提升,都對我們的生活產(chǎn)生了翻天覆地的影響。

在我們感受到的這些表象背后,實際發(fā)生的動作,是在深度學(xué)習(xí)訓(xùn)練過程涉及大規(guī)模的參數(shù)的網(wǎng)絡(luò)間傳遞。TensorFlow 使用中心化的網(wǎng)絡(luò)參數(shù)服務(wù)器(Parameter Server)來承擔(dān)梯度的收集、平均和分發(fā)工作,對 server 節(jié)點的訪問會成為瓶頸,帶寬利用率低。

為此,面向開發(fā)者的一站式AI開發(fā)平臺ModelArts 的團隊使用 AllReduce 算法來進行梯度聚合來優(yōu)化帶寬,同時對傳輸?shù)奶荻冗M行融合,對小于閾值大小的梯度多次傳輸合并為一次,提升帶寬利用率。

另外,在通信底層采用 nVIDIA 的 NvLink、P2P 等技術(shù)來提升節(jié)點內(nèi)和節(jié)點間通信帶寬,降低通信時延。它除了實現(xiàn)了加速比>0.85,性能的明顯提升外,基于此項技術(shù)的華為云ModelArts也憑借最快的訓(xùn)練速度榮登斯坦福DAWN Benchmark榜單。

順帶一提,如果大家對這項技術(shù)的應(yīng)用有興趣的話,可以留意一下ModelArts這個關(guān)鍵詞,后文有更多的應(yīng)用范例。

火眼金睛——圖神經(jīng)網(wǎng)絡(luò)

倘若大鬧天宮落敗的孫悟空沒有被關(guān)進太上老君的煉丹爐里,他的一雙火眼金睛必然也不會成型;沒有火眼金睛,日后的取經(jīng)路上降妖除魔斷顯然要更添幾分難度。而在華為面對開發(fā)者的發(fā)明創(chuàng)新中,順利化用了“火眼金睛“之名的技術(shù),無疑就是圖神經(jīng)網(wǎng)絡(luò)技術(shù)(GNN,Graph Neural Network)。

為何將二者進行對應(yīng),源于二者都是針對具體的圖像、畫面來進行分析,從而進行分析,給出結(jié)果。從技術(shù)角度來說,圖神經(jīng)網(wǎng)絡(luò)是在圖數(shù)據(jù)(非歐數(shù)據(jù))上的高階學(xué)習(xí)方法。

例如,在電子商務(wù)領(lǐng)域,一個基于圖的學(xué)習(xí)系統(tǒng)能夠利用用戶和產(chǎn)品之間的交互以實現(xiàn)高度精準(zhǔn)的推薦。在化學(xué)領(lǐng)域,分子被建模為圖,新藥研發(fā)需要測定其生物活性。在論文引用網(wǎng)絡(luò)中,論文之間通過引用關(guān)系互相連接,需要將它們分成不同的類別。

華為在ModelArts中的高效神經(jīng)網(wǎng)絡(luò)訓(xùn)練算子的基礎(chǔ)上,結(jié)合GES既有的高性能圖計算框架平臺能力,充分利用圖引擎高并發(fā)、低延時的特點,將GNN的訓(xùn)練過程高度并行化;使用統(tǒng)一架構(gòu)實現(xiàn)了非監(jiān)督的大規(guī)模圖嵌入和半監(jiān)督的圖卷積等多類GNN算法,降低了系統(tǒng)的維護成本。

這項高超技術(shù)不負眾望,榮獲了2019年人工智能峰會(CAIS)最高獎項紫金龍蟠獎。但一般的AI開發(fā)者目前對GNN算法和技術(shù)的觀念不足,想要快速迭代和優(yōu)化此項技術(shù),需要開發(fā)者們轉(zhuǎn)變以往的觀念,多多進入GNN這個“煉丹爐”,嘗試使用GNN算法。也希望每個開發(fā)者都能擁有這項“火眼金睛”的技術(shù),再復(fù)雜、無規(guī)則的圖數(shù)據(jù)也不是問題。

順帶一提,提到實際應(yīng)用,這里正好有一個鮮活的例子:

今年7月開始,華為云聯(lián)同上海交通大學(xué)、西安交通大學(xué)、江蘇大學(xué)、南京郵電大學(xué)等超過30所大學(xué)舉辦了一場華為云人工智能大賽 · 無人車挑戰(zhàn)杯,運用華為云AI開發(fā)平臺ModelArts以及端云協(xié)同解決方案HiLens,組織大學(xué)生自研編程和訓(xùn)練模型,根據(jù)預(yù)置考點進行障礙競速比賽。

號稱“更懂開發(fā)者的視覺AI應(yīng)用開發(fā)平臺”的華為云HiLens可在無人車上路前,通過攝像頭采集照片開始訓(xùn)練,免除采集、整合數(shù)據(jù)和設(shè)定算法的煩惱。而華為云ModelArts則提供開源數(shù)據(jù)集和自動學(xué)習(xí)、訓(xùn)練模型,在 ModelArts上進行分布式訓(xùn)練,可以縮短訓(xùn)練時長,加快訓(xùn)練速度,還具備創(chuàng)新的可視化全流程管理,讓實驗過程追蹤、結(jié)果復(fù)制不再難。

選手完成訓(xùn)練作業(yè)后,ModelArts開發(fā)的模型就能直接部署到HiLens攝像頭,實現(xiàn)端云協(xié)同,一鍵部署。(如果大家對這場賽事有興趣的話,請務(wù)必一定要看到最后,有驚喜!)

瞬間移動——輕量級的云化集成開發(fā)環(huán)境

它結(jié)合代碼編輯器的輕量極速、快速文件和目錄訪問操作,多語言高亮顯示等特性,以及IDE的代碼調(diào)試和代碼理解的能力,將用戶的集成開發(fā)環(huán)境部署在云端。尤其是AI輔助編碼能力,更是把傳統(tǒng)IDE的智能聯(lián)想功能提升了一個新高度,能對代碼上下文的語義分析和理解,讓開發(fā)者基于AI可以整行補全代碼,在理想狀態(tài)下可以為開發(fā)者節(jié)省90%的編碼工作。

不得不說,云上IDE無疑好處多多。比如,程序員們可以隨時隨地進行編程,即便他們在國外度假、異地出差,只要有一個能夠訪問瀏覽的終端,即可隨時隨地解決線上生產(chǎn)環(huán)境緊急故障,以及其他開發(fā)或運維等情況,避免臨時取消假期回去“救火”的情況發(fā)生。

玄光術(shù)——可視化全流程AI開發(fā)工程化技術(shù)

全流程AI開發(fā)工程化技術(shù)不但是可控的、可視化的、更是可追溯的,這一點和神仙透過鏡子使用玄光術(shù)追蹤的道理相似。

簡單來說,基于可視化全流程AI開發(fā)工程化技術(shù),華為云ModelArts可實現(xiàn)在 AI 開發(fā)全生命周期中,從原始數(shù)據(jù)、標(biāo)注數(shù)據(jù)、訓(xùn)練作業(yè)、算法、模型、推理服務(wù)等,提供全流程可視化管理;同時無需人工干預(yù),自動生成溯源圖,選擇任一模型,都可以找到對應(yīng)的數(shù)據(jù)集、參數(shù)、模型部署在哪里;可以說是華為“把復(fù)雜要留給自己,把簡單留給客戶和合作伙伴”理念的直接例證。

三頭六臂——多模分布式數(shù)據(jù)庫

支持多個數(shù)據(jù)模型,兼容兼MySQL, 文檔類型、寬表類型(如Cassandra)、內(nèi)存等多協(xié)議接口,融合的存儲計算分離的分布式架構(gòu),實現(xiàn)分鐘級節(jié)點擴容,秒級存儲擴容,支持跨3AZ和異地多活,軟硬件深度全棧垂直整合,可實現(xiàn)Serverless按需彈性伸縮按需使用。

在數(shù)據(jù)庫讀寫性能、靈敏性、可靠性等方面深度優(yōu)化,提供可視化實例管理平臺對實例創(chuàng)建、刪除、備份等需求實現(xiàn)一鍵式便捷操作。為開發(fā)者提供以100%兼容開源接口、多模型一致運維為核心的高性能、低成本、高可靠、高安全、易管理的新型分布式數(shù)據(jù)庫。

喚神術(shù)——智能化的軟件開發(fā)技術(shù)

這項技術(shù)通過機器學(xué)習(xí),對華為幾十年軟件開發(fā)所積累的大量相關(guān)數(shù)據(jù)進行挖掘清洗,結(jié)合各種分析技術(shù)將其中包含的開發(fā)知識進行復(fù)用,有效降低開發(fā)過程中低價值的、重復(fù)性的活動,例如自動檢測代碼中包含的缺陷、沖突等,并盡可能地提供修復(fù)建議。

縮小術(shù)——Huawei LiteOS IoT Stack技術(shù)

這項技術(shù)具備輕量級、低功耗、端云協(xié)同、即插即用、組件豐富、快速開發(fā)等關(guān)鍵能力,基于物聯(lián)網(wǎng)領(lǐng)域業(yè)務(wù)特征打造領(lǐng)域性技術(shù)棧,為開發(fā)者提供“一站式”完整軟件平臺,有效降低開發(fā)成本和難度、縮短開發(fā)周期。

以上,就是《西游記》愛好者快爺出品的華為面向開發(fā)者的“十大嚇人技術(shù)”新解。這些年來,華為一直不持續(xù)加大研發(fā)投入,大家有目共睹,為的就是尋求技術(shù)上的自主創(chuàng)新,打造更多更好的產(chǎn)品與服務(wù),為廣大開發(fā)者提供技術(shù)支撐,助力構(gòu)建萬物互聯(lián)的智能世界。

無論你是開發(fā)者還是普通消費者,如果你對快爺出品的這本“西游法術(shù)新解”感興趣,不妨關(guān)注一下即將于9月18~20日,在上海世博中心開幕的華為年度旗艦級大會——2019華為全聯(lián)接大會(HUAWEI CONNECT 2019)。

9月20日,更有以開發(fā)者為主角的Keynote演講及百場Session,上述提到的華為面向開發(fā)者的“十大嚇人技術(shù)”,都可以在百場Session中找到,屆時將會有來自技術(shù)大咖更全方位的解讀。前往現(xiàn)場,便可與頂級開發(fā)大神面對面,了解更多關(guān)于華為嚇人技術(shù)的最新理論與實踐!

——順帶一提,上文提到的華為云人工智能大賽·無人車挑戰(zhàn)杯,將在9月19日的全聯(lián)接大會現(xiàn)場決出冠軍!

東土華為仰至仁,創(chuàng)新萬物皆為善。

欲知云端新生態(tài),點擊鏈接來相見。 https://www.huawei.com/cn/press-events/events/huaweiconnect2019?ic_medium=hwdc&ic_source=corp_event2_hc2019

分享到

songjy

相關(guān)推薦