作為智象未來的堅實后盾,商湯大裝置為其提供了超穩(wěn)定、超高效的AI基礎(chǔ)設(shè)施支持,以極致的資源利用助力智象未來快速完成模型迭代沖刺,在新一輪競爭中鞏固核心競爭力、開拓應(yīng)用新場景。

智象未來技術(shù)總監(jiān)潘瀅煒博士表示:“作為AI創(chuàng)業(yè)公司,我們深知快速響應(yīng)行業(yè)變化的重要性。智象未來的模型迭代節(jié)奏快、訓(xùn)練強度大,對算力基礎(chǔ)設(shè)施的響應(yīng)速度、穩(wěn)定性和服務(wù)能力都有著極高需求。商湯大裝置‘靈活、穩(wěn)定、專業(yè)’的支持能力,為我們實現(xiàn)模型的多元化場景應(yīng)用、打通商業(yè)閉環(huán)提供了堅實基礎(chǔ),是我們值得信賴的長期合作伙伴。”

訓(xùn)練節(jié)奏按月迭代,算力需求既要也要

2023年3月,當行業(yè)還在驚嘆于ChatGPT震撼的對話式體驗時,剛剛成立的智象未來憑借在視頻內(nèi)容理解和生成領(lǐng)域的厚積薄發(fā)和敏銳洞察,前瞻地瞄準了圖像和視頻賽道的多模態(tài)技術(shù)方向,并在創(chuàng)立之初就制定了“1+3+N”的商業(yè)化布局策略,以1個大模型為基礎(chǔ),通過3條產(chǎn)品線形成市場觸點,滿足N種使用場景。

早在2024年初Sora發(fā)布前,智象未來自研的智象大模型便已具備15秒的文生視頻能力。在Sora發(fā)布之后,其迅速推出智象大模型2.0及3.0版本,將模型架構(gòu)從U-Net升級至Diffusion Transformer (DiT),不僅將視頻生成時長提升至分鐘級別,畫面自然度、內(nèi)容和角色一致性亦有顯著提升。更重要的是,智象大模型2.0率先實現(xiàn)開放使用,成為全球首個開放使用的圖像和視頻生成(DiT)架構(gòu)模型。目前,智象大模型已迭代至3.0版本,在架構(gòu)和應(yīng)用層面進一步突破。通過引入全新擴散自回歸架構(gòu)(DiT+AR),在提升生成質(zhì)量的同時降低推理能耗。在應(yīng)用層面,可廣泛應(yīng)用于運動鏡頭捕捉、影視特效制作、自然風(fēng)光模擬以及物理世界的數(shù)字重現(xiàn)等多個領(lǐng)域,展現(xiàn)了人工智能在創(chuàng)意產(chǎn)業(yè)與視覺藝術(shù)中的巨大潛力與應(yīng)用價值。

圖片2.png

不同于語言等單一模態(tài)模型,多模態(tài)模型的訓(xùn)練更加復(fù)雜。其不僅需要融合文本、圖像、音頻等多種模態(tài)信息,實現(xiàn)跨模態(tài)的深度理解與交互,而且訓(xùn)練任務(wù)更加多樣。不僅如此,智象多模態(tài)大模型還幾乎保持每月進行小版本迭代,每半年開展大版本升級的節(jié)奏,更對算力提出了“既要也要”的嚴苛要求:

一是要高效:大模型訓(xùn)練,效率就是一切,每一次版本升級都是一場與時間的賽跑。尤其是面對智象大模型版本迭代時的擴容需求,需要迅速調(diào)度充足算力資源,支持模型迭代沖刺。

二是要靈活:智象大模型具備圖片生成、視頻生成、圖像和視頻編輯等多種功能,不同模態(tài)信息的訓(xùn)練任務(wù)對算力需求各有不同,需要算力系統(tǒng)具備高度靈活性,能夠隨時根據(jù)訓(xùn)練任務(wù)的具體需要,匹配最優(yōu)算力方案。

三是要穩(wěn)定:大模型的訓(xùn)練需要連貫且穩(wěn)定的系統(tǒng)運行,任何一次系統(tǒng)中斷都可能導(dǎo)致訓(xùn)練失敗和資源浪費,因此算力系統(tǒng)必須具備7×24小時不間斷運行的絕對穩(wěn)定性,為模型迭代提供堅實后盾。

靈活、穩(wěn)定、專業(yè),為模型迭代穩(wěn)定護航

作為“最懂大模型的AI基礎(chǔ)設(shè)施”,商湯大裝置以“靈活、穩(wěn)定、專業(yè)”三板斧,通過靈活的算力資源調(diào)度,連續(xù)4周千卡不間斷訓(xùn)練和專業(yè)高效的專家服務(wù),助力智象未來實現(xiàn)了20%的資源利用率提升,讓每一份算力都發(fā)揮到極致。

靈活:千卡算力按需調(diào)度,實現(xiàn)最高投入產(chǎn)出比

充足的算力儲備、極速靈活的響應(yīng)能力是商湯大裝置的核心優(yōu)勢之一。在2024年初,商湯大裝置運營算力規(guī)模已達到12,000 PetaFlops,目前更已提升至23,000 PetaFlops。

為滿足智象未來的模型迭代沖刺需求,商湯大裝置不僅快速調(diào)度了千卡級別的算力資源,還提供了彈性的算力支持,可按需分配資源規(guī)模,通過靈活調(diào)度為智象未來提供最適配的算力方案。針對圖片生成、視頻生成、圖像和視頻編輯等不同訓(xùn)練任務(wù),都能通過資源自主劃分、靈活任務(wù)搶占機制,按照任務(wù)優(yōu)先級靈活進行資源分配,保證最大資源利用率,實現(xiàn)更高投入產(chǎn)出比、更高經(jīng)濟性的基礎(chǔ)。

穩(wěn)定:千卡4周不間斷,99.99%可靠性穩(wěn)定護航

在基于千卡集群的模型訓(xùn)練任務(wù)中,計算卡故障、通信異常等潛在問題如同暗礁,隨時可能會導(dǎo)致訓(xùn)練中斷等穩(wěn)定性問題,影響訓(xùn)練進度。如果說算力是大模型訓(xùn)練的核心“生產(chǎn)力”,那么穩(wěn)定性則代表著“安全感”。有安全感的生產(chǎn)力,才能真正提升生產(chǎn)效率。

從全程動態(tài)監(jiān)控到多項保障機制,商湯大裝置以99.99%的可靠穩(wěn)定性,做到算力“零閑置”。在模型訓(xùn)練過程中,可實時監(jiān)控設(shè)備狀態(tài),精準定位故障節(jié)點,并在第一時間發(fā)出告警;通過故障節(jié)點自動剔除機制,能夠迅速將問題節(jié)點隔離,減少訓(xùn)練中斷風(fēng)險;通過空閑節(jié)點無縫接入機制,讓訓(xùn)練任務(wù)能夠從斷點處迅速續(xù)訓(xùn),避免時間浪費。

得益于動態(tài)監(jiān)控、異常檢測等多種手段,商湯大裝置以分鐘級的訓(xùn)練容錯能力,助力智象未來成功實現(xiàn)了連續(xù)4周千卡不間斷訓(xùn)練的超穩(wěn)表現(xiàn),為模型迭代穩(wěn)定護航。

專業(yè):全鏈條專家服務(wù)支持,全程守護滿滿安全感

憑借在模型訓(xùn)練、AI Infra、模型量化推理等方面積累的深厚經(jīng)驗與專業(yè)知識,商湯專家服務(wù)團隊以敏捷、專業(yè)的支持能力,協(xié)助智象未來高效精準地完成問題定位和溯源,高效完成各類故障排查,并助力優(yōu)化訓(xùn)練流程、提升資源利用率。

全鏈路文生視頻解決方案,打通從數(shù)據(jù)到價值最后一公里

商湯大裝置解決方案專家孟凡笑認為:隨著文生視頻模型研發(fā)和應(yīng)用需求不斷涌現(xiàn),行業(yè)所需的將不僅僅是高效、穩(wěn)定的算力支持,而是從數(shù)據(jù)處理、到模型訓(xùn)練,再到推理部署的全鏈路解決方案。

圖片3.png

基于對文生視頻模型研發(fā)與應(yīng)用需求的深刻理解,商湯大裝置已形成涵蓋底層算力服務(wù)、IaaS服務(wù)以及文生視頻數(shù)據(jù)處理平臺的全鏈路文生視頻解決方案,以端到端的AI Infra能力打通從數(shù)據(jù)到價值的“最后一公里”。

在數(shù)據(jù)層面,可提供定制化的數(shù)據(jù)評估、視頻編碼、視頻超分等數(shù)據(jù)服務(wù),助力客戶應(yīng)對高質(zhì)量數(shù)據(jù)缺乏、數(shù)據(jù)處理難、存儲空間大等難題。同時提供私有化部署和公有云服務(wù)兩種靈活的服務(wù)模式,可滿足不同客戶需求。

在訓(xùn)練層面,可提供超大規(guī)模算力資源,并能根據(jù)任務(wù)需求進行靈活調(diào)度,且支持多芯混訓(xùn)、資源提效、性能優(yōu)化,實現(xiàn)極致的算力資源利用和模型訓(xùn)練效果提升。同時,還通過智能異常檢測、分鐘級自動容錯等多種手段組合,為模型訓(xùn)練提供極致穩(wěn)定性保障。

在推理層面,可提供從負載均衡調(diào)度、彈性擴縮容到服務(wù)優(yōu)化、模型壓縮、算法優(yōu)化的全方位、分層推理優(yōu)化方案,實現(xiàn)高吞吐、低時延的推理性能,有效滿足文生視頻場景對推理的實時性要求。

同時,作為全棧式解決方案的堅實后盾,商湯大裝置的全鏈條AI專家服務(wù)以全流程技術(shù)支撐和行業(yè)深度適配為核心,全面覆蓋業(yè)務(wù)場景洞察和定義、數(shù)據(jù)處理與構(gòu)造、大模型評測與能力選型、模型微調(diào)、模型蒸餾,再到模型部署與維護等AI模型開發(fā)和應(yīng)用全生命周期環(huán)節(jié),助力企業(yè)高效實現(xiàn) AI 應(yīng)用落地,在智能化轉(zhuǎn)型之路上穩(wěn)步邁進。

深化合作、共探場景升級,推動文生視頻持續(xù)爆發(fā)

得益于模型的快速迭代,智象未來的商業(yè)化進程迅猛發(fā)展,成立短短兩年以來,已累計服務(wù)100多個國家和地區(qū)的1000多萬用戶和4萬多家企業(yè),智象大模型已廣泛應(yīng)用于影視、文旅、通信、營銷、教育等場景。

未來,商湯大裝置與智象未來還將進行更深層次、更多維度的合作。除了算力層面,雙方還將針對視頻篩選、視頻編碼、視頻超分等數(shù)據(jù)處理,以及模型推理優(yōu)化等方面展開交流與合作探討,打造更優(yōu)質(zhì)、更高效、更易用的文生視頻服務(wù),滿足各行業(yè)客戶日益增長的多樣化需求。

圖片4.png

商湯大裝置與智象未來的合作實踐,為文生視頻領(lǐng)域的眾多創(chuàng)業(yè)公司提供了參考路徑。對于創(chuàng)業(yè)公司而言,與擁有大規(guī)模算力儲備和文生視頻全棧解決方案能力的AI云服務(wù)商合作,是加速模型迭代、實現(xiàn)快速發(fā)展的更優(yōu)路徑,能夠有效規(guī)避自建算力所需的高額一次性投資、漫長的時間成本及專業(yè)團隊投入難題,從而在激烈的競爭中“輕裝上陣”,將更多精力聚焦于模型研發(fā)、產(chǎn)品運營及客戶價值創(chuàng)造,不斷塑造自身核心競爭力。

商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆講到:“文生視頻技術(shù)仍處于行業(yè)發(fā)展的初級階段。隨著技術(shù)路線不斷演進、應(yīng)用場景的不斷爆發(fā),模型企業(yè)對于高質(zhì)量的數(shù)據(jù)獲取,以及低成本、高彈性的算力服務(wù)需求將愈發(fā)強烈,以支持模型訓(xùn)練和推理部署。面對這一趨勢,商湯大裝置還將不斷優(yōu)化平臺架構(gòu),提升解決方案能力,為文生視頻領(lǐng)域提供更加全面、靈活、易用且更具性價比的智算方案,助力文生視頻技術(shù)在實際行業(yè)應(yīng)用中發(fā)揮更大價值?!?/p>

分享到

songjy

相關(guān)推薦