“云邊端”全棧AI產(chǎn)品與解決方案

摩爾線程全功能GPU芯片采用自主研發(fā)的MUSA架構(gòu),率先實(shí)現(xiàn)了單芯片架構(gòu)同時(shí)支持 AI 計(jì)算加速、圖形渲染、物理仿真和科學(xué)計(jì)算、超高清視頻編解碼的技術(shù)突破。自2020年成立至今,摩爾線程已成功推出四代GPU架構(gòu)和智能SoC產(chǎn)品,拓展出覆蓋AI智算、專業(yè)圖形加速、桌面級圖形加速等領(lǐng)域豐富完整的計(jì)算加速產(chǎn)品矩陣,全面支持云計(jì)算、邊緣計(jì)算及終端設(shè)備市場,滿足從政務(wù)、企業(yè)智能計(jì)算到個(gè)人消費(fèi)場景的多層次需求。

——夸娥(KUAE):夸娥是以全功能GPU為硬件核心,軟硬一體化、完整的系統(tǒng)級算力解決方案,旨在為大規(guī)模GPU算力的建設(shè)和運(yùn)營管理提供系統(tǒng)級支持。KUAE為智算中心提供端到端解決方案,支持萬卡級規(guī)模擴(kuò)展能力,單集群可部署超1,000個(gè)計(jì)算節(jié)點(diǎn),每節(jié)點(diǎn)集成8顆自研OAM模組化GPU,通過3D全互聯(lián)拓?fù)鋵?shí)現(xiàn)亞微秒級通信延遲,為大模型預(yù)訓(xùn)練提供穩(wěn)定高效的算力支撐。其中,KUAE1是支持千卡互聯(lián)的第一代智算融合中心產(chǎn)品;KUAE2是2024年底推出的第二代大規(guī)模智算融合中心產(chǎn)品,支持萬卡互聯(lián)。

——全功能GPU OAM模組:摩爾線程自研全功能GPU高性能計(jì)算模塊,專為大規(guī)模智算集群設(shè)計(jì),可支持萬億級參數(shù)大模型訓(xùn)練與推理。摩爾線程全功能GPU在國內(nèi)率先支持FP8等全計(jì)算精度,滿足DeepSeek V3/R1等原生FP8計(jì)算需求,同時(shí)配備FP64算力,滿足科學(xué)應(yīng)用需求并加速AI for Science等場景。

——AI大模型一體機(jī)MCCX D800 X2:摩爾線程旗艦級GPU加速服務(wù)器MCCX D800 X2,專為大語言及多模態(tài)大模型、科學(xué)計(jì)算和物理仿真等前沿領(lǐng)域打造。該服務(wù)器基于摩爾線程全功能GPU模組與高速全互聯(lián)架構(gòu),全面釋放計(jì)算性能,為高性能計(jì)算集群的構(gòu)建提供強(qiáng)大支持,賦能企業(yè)在復(fù)雜AI場景中實(shí)現(xiàn)極致算力突破。

——大模型智算加速卡MTT S4000:訓(xùn)推兼顧,單卡支持 48GB 顯存和 768GB/s 的顯存帶寬?;谀柧€程自研MTLink技術(shù),MTT S4000 可以支持多卡互聯(lián),支持千卡集群基礎(chǔ)設(shè)施建設(shè),加速千億參數(shù)大語言模型計(jì)算。

——云端渲染卡MTT S3000:基于其多樣算力,借助覆蓋圖形渲染、視頻處理、深度學(xué)習(xí)的完整MUSA軟件棧,MTT S3000可為AI推理、云游戲、云渲染、視頻云、數(shù)字孿生、數(shù)字內(nèi)容創(chuàng)作等場景提供通用智算能力支持。

——桌面級圖形顯卡MTT S80:首款國產(chǎn)GPU游戲顯卡,支持多種主流圖形API,擁有14.7TFLOPS 的FP32算力,并搭配16GB GDDR6 高速顯存及PCIe Gen5 x16 接口,可支持 8K 超高清與4K 144Hz高刷新率顯示輸出。

——邊緣AI計(jì)算模組:摩爾線程基于邊緣AI計(jì)算模組打造了高性能、低延遲、強(qiáng)可靠的國產(chǎn)邊緣AI解決方案。該方案憑借50TOPS的高算力、全棧AI工具鏈以及端云協(xié)同架構(gòu),可廣泛應(yīng)用于工業(yè)、能源、教育、交通、醫(yī)療等行業(yè)。

摩爾線程還對以下內(nèi)容進(jìn)行了展示和介紹。

1)智能計(jì)算

大模型訓(xùn)練:實(shí)現(xiàn)高效AI訓(xùn)練,F(xiàn)P8算力與容錯(cuò)技術(shù)引領(lǐng)行業(yè)突破。摩爾線程KUAE2智算集群解決方案面向大規(guī)模智算中心,集成計(jì)算、存儲、網(wǎng)絡(luò)硬件及分布式計(jì)算軟件,最高支持10,240個(gè)全功能GPU部署。KUAE2兼顧AI與科學(xué)計(jì)算,覆蓋FP64至FP8全精度計(jì)算,支持AI、圖形、科學(xué)計(jì)算等全場景加速。

KUAE2具備高效的AI大模型訓(xùn)練能力,訓(xùn)練性能表現(xiàn)優(yōu)異,領(lǐng)先行業(yè)水平。同時(shí),依托于在FP8混合精度計(jì)算方面的原生優(yōu)勢,KUAE2與BF16相比精度幾乎無損,F(xiàn)P8 GEMM利用率達(dá)到行業(yè)領(lǐng)先水平。

大模型推理:國產(chǎn)GPU推理解決方案,打造極速DeepSeek體驗(yàn)。摩爾線程基于全新GPU的計(jì)算、通信、訪存等強(qiáng)大基礎(chǔ)能力,為國產(chǎn)GPU推理性能帶來了全新的極速體驗(yàn)?;趫D優(yōu)化、算子優(yōu)化、FP8精度計(jì)算等軟硬件深度優(yōu)化,打造集高性能、最佳全量體驗(yàn)和高精度模型等優(yōu)勢于一身的國產(chǎn)化推理解決方案。

運(yùn)行DeepSeek R1 671B 全量模型的單路解碼速度約100 token/s,處于行業(yè)領(lǐng)先水平。

2)科學(xué)計(jì)算

生命科學(xué):以全功能GPU強(qiáng)大算力,推動生命科學(xué)研究實(shí)現(xiàn)國產(chǎn)突破。智能計(jì)算與科學(xué)計(jì)算的融合正推動生命科學(xué)研究的變革。分子動力學(xué)模擬和分子對接技術(shù)能在原子層面解析生物分子相互作用,極大提升藥物研發(fā)效率,但也帶來巨大算力需求。 摩爾線程聯(lián)合北京大學(xué)、昌平實(shí)驗(yàn)室高毅勤課題組,基于國產(chǎn)SPONGE和DSDP軟件,打造了軟硬件協(xié)同的生命科學(xué)解決方案。

全功能GPU憑借全精度計(jì)算、強(qiáng)大兼容性和高性能優(yōu)勢,可高效運(yùn)行分子動力學(xué)、分子對接等科學(xué)計(jì)算軟件。同時(shí)還能夠加速AlphaFold等AI模型的訓(xùn)練推理,實(shí)現(xiàn)計(jì)算與AI的深度融合。該方案不僅突破傳統(tǒng)研究瓶頸,更在性能上達(dá)到行業(yè)領(lǐng)先水平,推動生命科學(xué)研究的國產(chǎn)化突破。

物理仿真:攜手硒鉬科技,開啟AI for Science科研新范式。硒鉬·秋月白AI是硒鉬科技研發(fā)的打造的AI for Science(AI4S)大模型平臺。該平臺深度融合AI與科學(xué)研究,通過智能任務(wù)規(guī)劃、多模態(tài)數(shù)據(jù)分析、動態(tài)數(shù)學(xué)建模和PhysicsAI物理反演等核心功能,為電氣工程、航天科技、流體力學(xué)等領(lǐng)域提供智能化的科研解決方案。

相比傳統(tǒng)CPU方案,平臺依托摩爾線程全功能GPU的強(qiáng)大算力與均衡的訓(xùn)推能力,在保持計(jì)算精度的同時(shí),可實(shí)現(xiàn)百倍以上的仿真效率提升,顯著加速科研進(jìn)程。其專有智能體系統(tǒng)能夠自動化處理科研中的重復(fù)性工作,推動科學(xué)研究向工程化、精準(zhǔn)化的新范式演進(jìn)。

3)圖形計(jì)算

空間智能:依托全功能GPU,補(bǔ)齊遙感智能解譯方案全國產(chǎn)關(guān)鍵一環(huán)。遙感大模型正成為處理海量地球觀測數(shù)據(jù)的關(guān)鍵技術(shù),可高效完成場景分類、目標(biāo)檢測等智能解譯任務(wù)。面對日均PB級數(shù)據(jù)增長,傳統(tǒng)算力已無法滿足實(shí)時(shí)分析需求,遙感的AI升級迫在眉睫。同時(shí)遙感數(shù)據(jù)多為國家重要數(shù)據(jù)資產(chǎn),構(gòu)建完全自主可控的全國產(chǎn)化解決方案亦成為當(dāng)務(wù)之急。

超圖遙感大模型通過智能化技術(shù)實(shí)現(xiàn)了從數(shù)據(jù)處理到分析解譯的全流程覆蓋,可高效完成場景分類、變化檢測、目標(biāo)識別等在內(nèi)的多類遙感影像解譯任務(wù)。依托全功能GPU,摩爾線程聯(lián)合超圖共同構(gòu)建了覆蓋訓(xùn)練、推理到可視化的完整國產(chǎn)化鏈條,支持億級參數(shù)模型開發(fā),并實(shí)現(xiàn)快速解譯和高清影像實(shí)時(shí)渲染,成為國內(nèi)極少數(shù)的可滿足遙感大模型全流程需求的國產(chǎn)GPU解決方案。

視頻超分:摩爾線程MTVSR,實(shí)時(shí)超分喚醒畫質(zhì)新生。實(shí)時(shí)視頻超分技術(shù)不僅能夠提升用戶的觀看體驗(yàn),更能有效節(jié)省視頻文件的存儲空間,降低存儲和網(wǎng)絡(luò)傳輸成本。

摩爾線程開發(fā)的端側(cè)實(shí)時(shí)視頻超分技術(shù)MTVSR,可提供2倍-4倍的實(shí)時(shí)視頻超分,并提供多檔質(zhì)量設(shè)定,能夠顯著提升低分辨率視頻在高分辨率屏幕下的播放清晰度。MTVSR還將以SDK形式支持播放器、瀏覽器等App集成調(diào)用,可為終端用戶提供無縫的實(shí)時(shí)視頻超分體驗(yàn)。

4)全功能GPU加速行業(yè)應(yīng)用。

全功能GPU+創(chuàng)娛教育:全功能GPU賦能創(chuàng)娛教育,用AI激發(fā)兒童無限創(chuàng)意?!癆I智繪童畫”是由摩爾線程與運(yùn)動加加聯(lián)合推出的創(chuàng)新教育應(yīng)用,基于摩爾線程AIGC技術(shù)及全功能GPU的強(qiáng)大算力,為用戶提供一站式、多模態(tài)的智能繪本創(chuàng)作體驗(yàn)。孩子只需簡單言語表達(dá),即可自由改編童話故事、生成專屬插畫,輕松完成個(gè)性化繪本創(chuàng)作。

目前,該應(yīng)用已登陸海信平臺,憑借強(qiáng)大的AI生成能力和友好的交互設(shè)計(jì),累計(jì)服務(wù)數(shù)十萬用戶。在趣味互動中培養(yǎng)孩子的表達(dá)力與創(chuàng)造力,讓學(xué)習(xí)與娛樂完美融合,開啟寓教于樂的全新體驗(yàn)。

全功能GPU+智能制造:攜手雪浪云,為制造業(yè)高質(zhì)量發(fā)展注入新動能。人工智能技術(shù)為高端裝備制造產(chǎn)業(yè)升級提供了巨大歷史機(jī)遇。摩爾線程工業(yè)領(lǐng)域合作伙伴雪浪云依托全功能GPU,打造了圖零大模型、工藝生成智能體和裝備運(yùn)維智能體等一系列產(chǎn)品,構(gòu)建了涵蓋工藝、生產(chǎn)與設(shè)備全流程的工業(yè)智能解決方案,實(shí)現(xiàn)了制造核心技術(shù)從底層到應(yīng)用的國產(chǎn)化閉環(huán)。

該解決方案以“國產(chǎn)GPU算力+國產(chǎn)模型+國產(chǎn)應(yīng)用”的全國產(chǎn)架構(gòu),將裝備制造業(yè)的海量經(jīng)驗(yàn)、數(shù)據(jù)和產(chǎn)業(yè)鏈優(yōu)勢轉(zhuǎn)換為產(chǎn)業(yè)發(fā)展的創(chuàng)新動力,為我國智能智造高質(zhì)量發(fā)展釋放生產(chǎn)力、打造競爭力。

全功能GPU+智慧醫(yī)療:攜手推想醫(yī)療,加速開啟智能醫(yī)療新時(shí)代。摩爾線程全功能GPU內(nèi)置圖形渲染、視頻編解碼、物理仿真、人工智能四大計(jì)算引擎,其自研的MUSA架構(gòu)能夠良好兼容CUDA生態(tài),在現(xiàn)今多模態(tài)發(fā)展趨勢下具備廣泛的兼容性與易用性。

依托全功能GPU 的強(qiáng)大優(yōu)勢,摩爾線程攜手合作伙伴推想醫(yī)療,成功完成冠脈CT造影圖像血管狹窄輔助評估軟件的國產(chǎn)化適配及遷移,突破AI算法開發(fā)環(huán)境、軟件運(yùn)行環(huán)境和基礎(chǔ)算力匹配的多重技術(shù)瓶頸,解決我國AI醫(yī)療軟件產(chǎn)品自主發(fā)展的重大難題,助力AI醫(yī)療領(lǐng)域?qū)崿F(xiàn)從芯片到軟件全面國產(chǎn)化的跨越。

全功能GPU+智能駕駛:構(gòu)建虛擬訓(xùn)練場,助力自動駕駛領(lǐng)域突破數(shù)據(jù)邊界。在自動駕駛領(lǐng)域,”世界模型”正在成為訓(xùn)練系統(tǒng)的核心工具。它通過模擬真實(shí)駕駛環(huán)境,為AI提供了高效、安全的學(xué)習(xí)平臺。就像人類通過觀察和實(shí)踐掌握駕駛技能一樣,AI依賴世界模型來理解和適應(yīng)復(fù)雜道路場景。

摩爾線程全功能GPU憑借其卓越的圖形渲染、AI計(jì)算和視頻編解碼能力,為極佳科技的世界模型平臺提供了強(qiáng)大的算力基座。通過媲美行業(yè)標(biāo)桿的視覺精度與穩(wěn)定算力輸出,不僅可以滿足自動駕駛對高精度數(shù)據(jù)的嚴(yán)苛需求,還能持續(xù)為世界模型提供優(yōu)質(zhì)的訓(xùn)練素材,推動自動駕駛技術(shù)快速迭代,加速自動駕駛領(lǐng)域突破數(shù)據(jù)瓶頸。

全功能GPU+數(shù)字服務(wù):摩爾線程數(shù)字人全棧解決方案,全鏈路定制服務(wù)賦能企業(yè)智能升級。摩爾線程數(shù)字人解決方案基于全功能GPU強(qiáng)大算力,深度融合圖形渲染、AI計(jì)算與視頻編解碼技術(shù),打造軟硬一體化的交互方案。新一代聲像模型驅(qū)動高清數(shù)字人,呈現(xiàn)逼真自然的音色與畫面;界面設(shè)計(jì)簡潔,支持一鍵切換形象與音色;全雙工交互技術(shù)實(shí)現(xiàn)毫秒級響應(yīng),支持實(shí)時(shí)語音打斷,讓對話流暢自然。

依托端云協(xié)同架構(gòu),方案在確保數(shù)據(jù)安全的同時(shí),為政務(wù)、銀行、企業(yè)等服務(wù)場景提供定制化智能交互服務(wù)。通過從硬件到終端的全鏈路國產(chǎn)化技術(shù),助力企業(yè)構(gòu)建自主可控的數(shù)字化服務(wù)體系,實(shí)現(xiàn)服務(wù)體驗(yàn)與運(yùn)營效率的雙重提升。

全功能GPU+智能座艙:國產(chǎn)智能座艙域控方案,重塑高端駕乘新體驗(yàn)。摩爾線程與合作伙伴紫光計(jì)算機(jī)共同打造的全國產(chǎn)高端智能座艙域控方案,集成了高性能顯示、強(qiáng)大AI計(jì)算能力于一體。該方案最高支持8塊4K屏幕同時(shí)輸出,并具備8K硬件編解碼能力,配合媲美獨(dú)立顯卡的3D渲染性能,能夠流暢呈現(xiàn)各類復(fù)雜場景。

平臺提供高達(dá)50TOPS的本地AI算力,支持大語言模型和圖像識別算法在終端側(cè)部署運(yùn)行,結(jié)合預(yù)裝的數(shù)字人穆莎等AI應(yīng)用,在兼容Linux和Android系統(tǒng)的同時(shí),實(shí)現(xiàn)了從硬件底層到軟件交互的完整智能座艙解決方案。

分享到

xiesc

相關(guān)推薦