目前國(guó)外的AI框架有很多,其中包括TensorFlow、PyTorch、Keras、Theano、MXNet等深度學(xué)習(xí)框架;Scikit-learn、LightGBM等機(jī)器學(xué)習(xí)框架;OpenCV、Scikit-Image等計(jì)算機(jī)視覺(jué)框架以及NLTK、AllenNLP等自然語(yǔ)言處理框架。國(guó)內(nèi)則有昇思 MindSpore、飛槳(PaddlePaddle)、OneFlow、曠視天元(MegEngine)和計(jì)圖(Jittor)等。

這里的AI框架非常重要。它使得用戶(hù)、開(kāi)發(fā)者無(wú)需從頭編寫(xiě)復(fù)雜的底層代碼,而是借助AI框架集成的算法、數(shù)據(jù)結(jié)構(gòu)和工具,提高開(kāi)發(fā)的效率,例如動(dòng)態(tài)計(jì)算圖的功能特性方便研究人員隨時(shí)調(diào)整模型結(jié)構(gòu)和參數(shù);內(nèi)置的隨機(jī)梯度下降、Adagrad、Adadelta 等工具,能夠自動(dòng)調(diào)整模型參數(shù),加快模型訓(xùn)練速度,提高模型的準(zhǔn)確性和泛化能力。

試想對(duì)于用戶(hù)而言,目前會(huì)有幾十種訓(xùn)練好的模型,以及算法可供選擇,同時(shí)需要考星到硬件資源并行程度,以及跨平臺(tái)部署等技術(shù)問(wèn)題,沒(méi)有一個(gè)好的AI框架來(lái)承擔(dān)這些基礎(chǔ)工作,任何美好的想法和愿望也是很難滿足和實(shí)現(xiàn)的。

AI框架媲美超越 CUDA

在AI大模型時(shí)代,我們見(jiàn)證了英偉達(dá)的成功,也驚嘆于GPU提供的強(qiáng)大算力,但很多時(shí)候,我們忽略了CUDA對(duì)于英偉達(dá)GPU成功的重要性。

CUDA 是的一種并行計(jì)算平臺(tái)和編程模型,主要用于GPU高效并行計(jì)算,提供了直接操作GPU硬件的接口和工具,使得開(kāi)發(fā)人員能夠利用 GPU 的強(qiáng)大計(jì)算能力來(lái)加速各種計(jì)算任務(wù),尤其是深度學(xué)習(xí)模型的訓(xùn)練和推理過(guò)程 。但CUDA 并不算一種 AI 框架,AI 框架通常提供了豐富的神經(jīng)網(wǎng)絡(luò)層、模型構(gòu)建模塊以及訓(xùn)練算法等,方便用戶(hù)直接構(gòu)建和訓(xùn)練各種深度學(xué)習(xí)模型。而 CUDA 主要是提供了一種并行計(jì)算的編程接口和工具,用于在 NVIDIA 的 GPU 上進(jìn)行高效的計(jì)算,本身并不具備直接構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型的功能。

AI 框架往往集成了大量的高級(jí)算法和工具,如自動(dòng)微分、優(yōu)化器、數(shù)據(jù)增強(qiáng)等,以方便用戶(hù)進(jìn)行模型的開(kāi)發(fā)和優(yōu)化。CUDA 則主要關(guān)注于 GPU 的并行計(jì)算,對(duì)于這些高級(jí)算法和工具的支持相對(duì)較少。為了彌補(bǔ)CUDA在這方面的不足,英偉達(dá)的策略是加強(qiáng)與主流的深度學(xué)習(xí)框架,如 PyTorch、TensorFlow 等的合作,開(kāi)發(fā)了一系列與 CUDA 緊密集成的工具和插件,方便用戶(hù)調(diào)用。與此同時(shí),針對(duì)卷積、池化、歸一化等常用神經(jīng)網(wǎng)絡(luò)操作以及加速數(shù)據(jù)加載和預(yù)處理的過(guò)程,英偉達(dá)提供了cuDNN(CUDA Deep Neural Network library)、 DALI(Data Loading Library)等加速庫(kù)的支持,提供了英偉達(dá)的 TAO(Transfer Learning Toolkit)開(kāi)發(fā)和部署工具包,集成了大量開(kāi)源的示例代碼和預(yù)訓(xùn)練模型庫(kù),英偉達(dá)積極建立和維護(hù) CUDA 開(kāi)發(fā)者社區(qū),通過(guò)舉辦技術(shù)研討會(huì)、線上論壇、線下活動(dòng)等方式,促進(jìn)開(kāi)發(fā)者之間的交流和合作。

CUDA的成功也預(yù)示著AI框架光明的未來(lái)。以昇思MindSpore為例,自2020年開(kāi)源以來(lái),目前已孵化、支持國(guó)內(nèi)外50多個(gè)主流大模型;覆蓋全球130多個(gè)國(guó)家和地區(qū)的2400多個(gè)城市;3.7萬(wàn)多名開(kāi)發(fā)者參與社區(qū)貢獻(xiàn);聯(lián)合1700多位生態(tài)伙伴,打造超過(guò)2000+解決方案,據(jù)預(yù)測(cè)中國(guó)AI框架2024年新增市場(chǎng)昇思份額將達(dá)30%。

可以說(shuō),以昇思MindSpore為代表的AI框架將是大模型時(shí)代,行業(yè)用戶(hù)擁抱AI,讓AI落地的最強(qiáng)有力的武器,除此之外,沒(méi)有太多的捷徑可走。

小結(jié)

所謂授人魚(yú),不如授人以漁。大模型時(shí)代,行業(yè)用戶(hù)的漁就是AI框架,自己動(dòng)手,豐衣足食。這里的重點(diǎn)是自己動(dòng)手DIY,不要等待Total Solution,不要等待“交鑰匙”工程,如此,才能夠跟上AI大模型時(shí)代發(fā)展的步伐。

分享到

songjy

相關(guān)推薦