DeepSeek的爆發(fā)式適配,不僅是一場(chǎng)技術(shù)狂歡,更揭示了國(guó)產(chǎn)AI發(fā)展的新范式——從依賴單一算力規(guī)模轉(zhuǎn)向“芯片-模型-場(chǎng)景”協(xié)同優(yōu)化。
文字編輯| 宋雨涵
1
國(guó)產(chǎn)芯片與大模型的“雙向奔赴”
推動(dòng)產(chǎn)業(yè)鏈協(xié)同發(fā)展
技術(shù)實(shí)力與協(xié)同效應(yīng):這些企業(yè)能夠快速完成對(duì)DeepSeek模型的適配,充分展示了中國(guó)AI產(chǎn)業(yè)鏈的技術(shù)實(shí)力和協(xié)同效應(yīng)。DeepSeek的創(chuàng)新提升了算力使用效率,降低了算力硬件的門檻,無(wú)需依賴高端芯片也可實(shí)現(xiàn)應(yīng)用落地。
市場(chǎng)影響:隨著DeepSeek模型在國(guó)產(chǎn)AI芯片上的快速適配,有望推動(dòng)國(guó)產(chǎn)AI芯片在推理場(chǎng)景的應(yīng)用,減少對(duì)海外硬件的依賴。同時(shí),這也為構(gòu)建自主可控的人工智能技術(shù)生態(tài)奠定了基礎(chǔ)。
行業(yè)趨勢(shì):從芯片到算法,從算力到應(yīng)用,再到云服務(wù),DeepSeek的出現(xiàn)促進(jìn)了整個(gè)產(chǎn)業(yè)鏈的協(xié)同進(jìn)化。科技創(chuàng)新正從“硬件堆砌”的競(jìng)賽轉(zhuǎn)向“算法-硬件-場(chǎng)景”協(xié)同發(fā)展,未來(lái)競(jìng)爭(zhēng)更依賴生態(tài)整合能力而非單一技術(shù)優(yōu)勢(shì)。
從“替代”到“引領(lǐng)”的轉(zhuǎn)型信號(hào)
資本市場(chǎng)熱度飆升:科創(chuàng)芯片ETF規(guī)模突破204億元,寒武紀(jì)、龍芯中科等概念股春節(jié)后股價(jià)連續(xù)漲停。
華為昇騰、沐曦等芯片獨(dú)角獸借勢(shì)加速IPO進(jìn)程,國(guó)產(chǎn)AI芯片產(chǎn)業(yè)迎來(lái)資本密集注入。
破解“卡脖子”難題:通過(guò)昇騰自研推理引擎,DeepSeek在國(guó)產(chǎn)硬件上的效果已比肩國(guó)際高端GPU。
南京智算中心、浙東南智算中心基于全國(guó)產(chǎn)算力部署滿血版DeepSeek模型,推動(dòng)零售、工業(yè)等垂直場(chǎng)景應(yīng)用。
企業(yè)級(jí)部署門檻降低:聯(lián)想聯(lián)合沐曦推出訓(xùn)推一體機(jī),企業(yè)可低成本實(shí)現(xiàn)本地化AI部署;浪潮云、青云科技等推出預(yù)置模型的一體機(jī)方案,滿足國(guó)央企、高校的私有化需求。
2
這些企業(yè)具體做了些什么?
1、華為昇騰2月1日,華為云宣布與硅基流動(dòng)聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeek R1/V3推理服務(wù)。得益于自研推理加速引擎加持,該服務(wù)支持部署的DeepSeek模型可獲得持平全球高端GPU部署模型的效果。2月4日,DeepSeek R1、V3、V2、Janus-Pro模型正式上線昇騰社區(qū),支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺(tái)上開箱即用,推理快速部署。天翼云、聯(lián)通云、移動(dòng)云三大運(yùn)營(yíng)商云均已采用昇騰算力底座來(lái)支持DeepSeek模型。神州數(shù)碼也特別提到其神州鯤泰推理服務(wù)器產(chǎn)品搭載昇騰硬件,可全面支持DeepSeek模型的快速部署。
2、沐曦國(guó)產(chǎn)GPU獨(dú)角獸沐曦對(duì)DeepSeek的支持,由國(guó)內(nèi)一站式大模型托管平臺(tái)Gitee AI代為官宣。Gitee AI在2月2日宣布上線1.5B、7B、14B、32B四個(gè)尺寸的DeepSeek R1模型并均部署在國(guó)產(chǎn)沐曦曦云GPU上。2月5日,Gitee AI再度發(fā)文,宣布經(jīng)測(cè)試已確認(rèn)DeepSeek-V3全精度滿血版(671B)可以成功運(yùn)行在沐曦訓(xùn)推一體GPU上,并將V3滿血版上線到平臺(tái)上。同日,聯(lián)想聯(lián)合沐曦發(fā)布基于DeepSeek大模型的首個(gè)國(guó)產(chǎn)一體機(jī)解決方案。該方案以“聯(lián)想服務(wù)器/工作站+沐曦訓(xùn)推一體國(guó)產(chǎn)GPU+自主算法”為核心架構(gòu),配合聯(lián)想AI Force智能體開發(fā)平臺(tái),推出智能體一體機(jī)與訓(xùn)推一體服務(wù)器雙產(chǎn)品形態(tài)。面向敏捷部署的DeepSeek智能體一體機(jī),采用ThinkStation PX工作站為載體,搭載沐曦曦思N260國(guó)產(chǎn)GPU,可支持本地部署DeepSeek各種參數(shù)蒸餾模型推理。面向更廣泛場(chǎng)景的DeepSeek訓(xùn)推一體機(jī),基于聯(lián)想問(wèn)天WA5480 G3 AI服務(wù)器,搭載8張曦云C500國(guó)產(chǎn)GPU,可為大模型訓(xùn)練和推理提供強(qiáng)大的算力支撐。浪潮云在2月7日發(fā)布的預(yù)置DeepSeek R1和V3模型的海若一體機(jī)時(shí),也采用了沐曦的國(guó)產(chǎn)GPU。
3、天數(shù)智芯2月4日,天數(shù)智芯與Gitee AI聯(lián)合發(fā)布,在雙方的高效協(xié)作下,僅用時(shí)一天,便成功完成了與DeepSeek R1的適配工作,并已正式上線多款大模型服務(wù),包括1.5B、7B、14B等尺寸。
天數(shù)智芯還在聯(lián)合并行科技、算力互聯(lián)等多家伙伴,全力開展DeepSeek多款模型的適配與上線。此前,DeepSeek V3 671B剛一發(fā)布,天數(shù)智芯便迅速響應(yīng),完成了與該模型的適配工作。經(jīng)測(cè)試與驗(yàn)證,適配后的模型精度高度對(duì)標(biāo)論文精度,展現(xiàn)出出色的穩(wěn)定性與可靠性,可快速投入應(yīng)用場(chǎng)景。
4、摩爾線程2月4日,摩爾線程宣布快速實(shí)現(xiàn)DeepSeek R1蒸餾模型推理服務(wù)在摩爾線程夸娥(KUAE)GPU智算集群上的高效部署。摩爾線程即將開放夸娥GPU智算集群,全面支持DeepSeek V3、R1模型及新一代蒸餾模型的分布式部署。用戶也可以基于摩爾線程MTT S80和MTT S4000顯卡進(jìn)行DeepSeek-R1蒸餾模型的推理部署。早在1月28日,就已經(jīng)有B站UP主在MTT S80上手動(dòng)完成推理DeepSeek R1模型的實(shí)踐?;贠llama開源框架,摩爾線程完成DeepSeek-R1-Distill-Qwen-7B蒸餾模型的部署,并在多種中文任務(wù)中展現(xiàn)了優(yōu)異的性能,驗(yàn)證了摩爾線程全功能GPU的通用性與CUDA兼容性。
5、海光信息2月4日~5日,海光信息宣布其技術(shù)團(tuán)隊(duì)近日成功完成DeepSeek V3模型、R1模型、Janus-Pro多模態(tài)大模型與海光DCU的適配優(yōu)化,并正式上線。DCU(深度計(jì)算單元)是海光信息推出的高性能GPGPU架構(gòu)AI加速卡,DeepSeek模型可直接在DCU上運(yùn)行,并不需要大量適配工作,技術(shù)團(tuán)隊(duì)的主要工作是進(jìn)行精度驗(yàn)證和持續(xù)的性能優(yōu)化。用戶可通過(guò)“光合開發(fā)者社區(qū)”中的“光源”板塊訪問(wèn)并下載相關(guān)模型,或登錄?[www.sourcefind.cn]?搜索“DeepSeek”,即可基于DCU平臺(tái)快速部署和使用相關(guān)模型。
6、壁仞科技2月5日,壁仞科技宣布壁仞AI算力平臺(tái)正式上線DeepSeek R1全系列蒸餾模型推理服務(wù),供開發(fā)者云端體驗(yàn)。該服務(wù)具備兩大核心優(yōu)勢(shì):一是零部署成本,實(shí)現(xiàn)“開箱即用”的云端推理體驗(yàn);二是多場(chǎng)景覆蓋,針對(duì)大語(yǔ)言模型等不同任務(wù)預(yù)置優(yōu)化配置方案。壁仞科技已聯(lián)合上海智能算力科技有限公司、中興通訊、科華數(shù)據(jù)、無(wú)問(wèn)芯穹、開源中國(guó)(Gitee AI)、UCloud優(yōu)刻得、一驀科技等戰(zhàn)略伙伴,基于壁礪系列訓(xùn)推產(chǎn)品106M、106B、106E、110E,全面開展DeepSeek全系列模型的適配與上線。同日,UCloud優(yōu)刻得發(fā)文宣布,優(yōu)刻得與壁礪系列進(jìn)行適配兼容,僅用數(shù)小時(shí)即完成了對(duì)DeepSeek R1全系列蒸餾模型的支持。
7、太初元碁2月5日,太初元碁宣布在太初T100加速卡上僅用2小時(shí)便完成DeepSeek-R1系列模型的適配工作,快速上線多款大模型服務(wù)。DeepSeek-R1系列模型可在太初元碁官網(wǎng)的模型中心獲取。該模型中心為用戶提供免費(fèi)的太初T100加速卡,并提供模型權(quán)重下載、在線/離線推理腳本、模型評(píng)測(cè)腳本等全流程內(nèi)容。當(dāng)前,DeepSeek-R1系列推理API無(wú)限量限時(shí)免費(fèi)。太初元碁正積極聯(lián)手京算、是石科技、神威數(shù)智、龍芯中科等合作伙伴,全力打造DeepSeek系列模型的云端推理平臺(tái)。
8、云天勵(lì)飛2月5日,云天勵(lì)飛宣布其芯片團(tuán)隊(duì)完成DeepEdge10芯片平臺(tái)與DeepSeek R1(1.5B、7B、8B)大模型的適配,可以交付客戶使用。DeepSeek R1(32B、70B)以及V3/R1 671B MoE大模型也在有序適配中。適配完成后,DeepEdge10芯片平臺(tái)將在端、邊、云全面支持DeepSeek全系列模型。
9、燧原科技2月6日,燧原科技宣布完成了對(duì)DeepSeek全量模型的高效適配,包括DeepSeek R1/V3 671B原生模型和蒸餾模型。目前,DeepSeek的全量模型已在慶陽(yáng)、無(wú)錫、成都等智算中心完成了數(shù)萬(wàn)卡的快速部署。這一成果標(biāo)志著燧原科技在國(guó)內(nèi)率先實(shí)現(xiàn)了DeepSeek全量模型的部署和落地。燧原科技與并濟(jì)科技、并行科技、東華軟件、道客網(wǎng)絡(luò)、光環(huán)云、邁富時(shí)、清程極智、燧弘華創(chuàng)、未來(lái)速度、無(wú)問(wèn)芯穹、向量棧、億算智能、中科加禾等合作伙伴緊密合作,積極推進(jìn)DeepSeek全量模型的更多系統(tǒng)級(jí)優(yōu)化,進(jìn)一步推理性價(jià)比。燧原科技還與萬(wàn)物安全、飛渡科技、萬(wàn)物之宜等深度合作,即將推出面向智慧城市、智慧園區(qū)、智慧交通等AIoT場(chǎng)景的國(guó)內(nèi)首個(gè)DeepSeek智算訓(xùn)推一體機(jī),幫助用戶解決國(guó)產(chǎn)化私有算力、超清數(shù)字孿生及物聯(lián)網(wǎng)安全等問(wèn)題。
10、昆侖芯2月6日,昆侖芯宣布已完成Deepseek R1、V3系列模型訓(xùn)練推理全版本適配,包括MoE模型及其蒸餾小模型,且性能卓越、成本效率極致,一鍵部署。據(jù)介紹,P800顯存規(guī)格優(yōu)于同類主流GPU 20%-50%,對(duì)MoE架構(gòu)更加友好,且率先支持8bit推理,單機(jī)8卡即可運(yùn)行671B模型,可輕松完成DeepSeek-V3/R1全版本推理任務(wù);并能支撐Deepseek系列MoE模型大規(guī)模訓(xùn)練任務(wù),僅需32臺(tái)即可支持模型全參訓(xùn)練,高效完成模型持續(xù)訓(xùn)練和微調(diào)。昆侖芯前身為百度智能芯片及架構(gòu)部,于2021年4月完成獨(dú)立融資。2月5日,百度智能云宣布其成功點(diǎn)亮昆侖芯三代P800萬(wàn)卡集群,三萬(wàn)卡集群也將于近日點(diǎn)亮。
11、靈汐科技2月6日,靈汐科技宣布,節(jié)后開工第一天,其團(tuán)隊(duì)聯(lián)合類腦技術(shù)社區(qū)(“腦啟社區(qū)”)的開發(fā)者,僅用半天時(shí)間,就完成了DeepSeek-R1系列模型在靈汐KA200類腦芯片及相關(guān)智算卡的適配,助力國(guó)產(chǎn)大模型與類腦智能硬件系統(tǒng)的深度融合。據(jù)?“腦啟社區(qū)“的開發(fā)者反饋,在DeepSeek-R1-Distill-Qwen的1.5B、7B等系列模型測(cè)試中,模型在4K上下文情形下體驗(yàn)順暢,具備交付客戶使用的能力。后續(xù),靈汐科技也將聯(lián)合產(chǎn)業(yè)生態(tài)伙伴及腦啟社區(qū),適時(shí)發(fā)布云上服務(wù)。
12、鯤云科技2月6日,鯤云科技宣布其全新一代可重構(gòu)數(shù)據(jù)流AI芯片CAISA 430成功適配DeepSeek R1蒸餾模型推理。CAISA 430的可重構(gòu)數(shù)據(jù)流架構(gòu)能夠根據(jù)DeepSeek R1模型的特點(diǎn)進(jìn)行動(dòng)態(tài)配置,生成面向該模型的高性能定制化流水線,進(jìn)一步優(yōu)化推理性能。該芯片原生支持DeepSeek R1蒸餾模型的開源基礎(chǔ)模型。DeepSeek R1的Qwen和Llama模型可直接在CAISA 430上運(yùn)行,不需要復(fù)雜的適配工作。
13、希姆計(jì)算2月6日,希姆計(jì)算宣布其技術(shù)團(tuán)隊(duì)僅用數(shù)小時(shí),就將DeepSeek R1全系列蒸餾模型快速適配到自研RISC-V開源指令集的推理加速卡系列之上,并落地全國(guó)多個(gè)千卡級(jí)以上智算中心。企業(yè)級(jí)用戶可通過(guò)希姆智算云平臺(tái),一鍵使用DeepSeek R1全系列蒸餾模型。
14、算能2月7日,算能宣布,搭載算豐第四代智能視覺深度學(xué)習(xí)處理器BM1684的算能微服務(wù)器SE7,已完成DeepSeek R1 7B/1.5B蒸餾模型適配,性能強(qiáng)勁,為R1蒸餾模型提供最佳國(guó)產(chǎn)邊緣部署方案。
15、清微智能2月7日,清微智能宣布其可重構(gòu)算力芯片RPU已完成DeepSeek R1系列模型的適配和部署運(yùn)行。清微智能算力服務(wù)器具有訓(xùn)推一體特點(diǎn),支持無(wú)交換機(jī)自組網(wǎng)調(diào)度,顯著提升計(jì)算資源利用率與能效比,單機(jī)支持DeepSeek全尺寸模型,具有高性價(jià)比特點(diǎn)。除推理外,該服務(wù)器高性能支持基于DeepSeek模型對(duì)其他模型進(jìn)行蒸餾訓(xùn)練,便于實(shí)現(xiàn)大模型本地私有化部署。
16、芯動(dòng)力2月7日,芯動(dòng)力宣布在24小時(shí)內(nèi)完成了與DeepSeek R1大模型的適配。其高性能AI加速卡AzureBlade K340L M.2內(nèi)嵌AE7100芯片,尺寸大約半張名片大小,算力達(dá)到32TOPS,功耗不到8W,已經(jīng)可以支撐大模型在AI PC等設(shè)備上運(yùn)行。
3
未來(lái)展望
展望未來(lái),隨著DeepSeek技術(shù)的不斷成熟和應(yīng)用場(chǎng)景的不斷拓展,其在產(chǎn)業(yè)中的影響力將進(jìn)一步擴(kuò)大。一方面,DeepSeek將繼續(xù)深耕技術(shù)創(chuàng)新,不斷提升模型的性能和效率;另一方面,DeepSeek將加強(qiáng)與產(chǎn)業(yè)鏈上下游企業(yè)的合作與聯(lián)動(dòng),共同推動(dòng)AI技術(shù)的普及和應(yīng)用。
對(duì)于國(guó)產(chǎn)AI芯片企業(yè)而言,與DeepSeek的合作將是一次難得的發(fā)展機(jī)遇。通過(guò)共同探索AI技術(shù)的無(wú)限可能,這些企業(yè)有望在激烈的市場(chǎng)競(jìng)爭(zhēng)中脫穎而出,成為推動(dòng)中國(guó)AI產(chǎn)業(yè)發(fā)展的中堅(jiān)力量。同時(shí),聯(lián)網(wǎng)搜索功能的加入也將為這些企業(yè)帶來(lái)更多的市場(chǎng)機(jī)會(huì)和商業(yè)價(jià)值,助力其在未來(lái)的發(fā)展中取得更加輝煌的成就。