色吊网久久,综合图区亚洲欧美另类图片

在訓(xùn)練場(chǎng)景下，使用該高性能算子庫(kù)可將上文Stable Diffusion模型在128張A100的訓(xùn)練時(shí)間從25天減少到15天，訓(xùn)練性能提升40%。同時(shí)，由于AIGC模型在訓(xùn)練時(shí)占用GPU顯存容量非常大，未經(jīng)優(yōu)化時(shí)的模型只能運(yùn)行在最高端的A100 80GB GPU卡上?；鹕揭娓咝阅芩阕訋?kù)通過大量消減中間操作，將運(yùn)行時(shí)GPU顯存占用量降低50%，使得大多數(shù)模型可從A100遷移到成本更低的V100或A30等GPU卡上運(yùn)行，擺脫特定計(jì)算卡的限制，而且不需要做額外的模型轉(zhuǎn)換工作。

以此，以AIGC場(chǎng)景為代表，無論是迭代速度，還是單次的訓(xùn)練成本，都有了顯著的性能提升和成本節(jié)省。未來，火山引擎云服務(wù)將持續(xù)在機(jī)器學(xué)習(xí)、科學(xué)計(jì)算、圖形處理等領(lǐng)域深耕，不斷追求極致性能。

分享到

火山引擎

xiesc

相關(guān)推薦

近期文章

熱門標(biāo)簽