(發(fā)布儀式)

陳純院士對DeepSeek-R1-Safe基礎(chǔ)大模型發(fā)布表示祝賀,感謝華為長期支持。他指出,浙江大學(xué)計算機(jī)學(xué)院已組建起一支涵蓋多位海內(nèi)外優(yōu)秀青年人才的科研團(tuán)隊(duì),并已成功依托昇騰生態(tài),實(shí)現(xiàn)了自主全流程后訓(xùn)練框架,完成了國內(nèi)首次千卡集群大模型安全訓(xùn)練。這次DeepSeek-R1-Safe的發(fā)布旨在打造安全可信的示范應(yīng)用,推動大模型安全能力與產(chǎn)業(yè)生態(tài)協(xié)同發(fā)展。他表示希望團(tuán)隊(duì)未來與華為展開更深入合作,共同推動我國 AI 技術(shù)進(jìn)步。

中國工程院院士 陳純

張迪煊表示,自2019年以來,華為在應(yīng)對外部環(huán)境變化的過程中持續(xù)加大研發(fā)投入,突破多項(xiàng)關(guān)鍵核心技術(shù),在硬件與產(chǎn)業(yè)生態(tài)建設(shè)方面取得了一系列成果。在華為全聯(lián)接大會2025上,華為也正式推出了昇騰新一代AI硬件與全系列軟件開源開放戰(zhàn)略,覆蓋編譯器、運(yùn)行時驅(qū)動等核心組件,致力于通過深度開放協(xié)作,聯(lián)合高校與產(chǎn)業(yè)伙伴共同推動基礎(chǔ)軟件創(chuàng)新與AI安全能力建設(shè)。他強(qiáng)調(diào),華為堅信,與浙江大學(xué)的緊密合作將有助于進(jìn)一步增強(qiáng)源頭創(chuàng)新能力,共同筑牢安全、可信、有競爭力的AI產(chǎn)業(yè)生態(tài),為我國人工智能的高質(zhì)量發(fā)展保駕護(hù)航。

華為昇騰計算業(yè)務(wù)總裁 張迪煊

隨后,任奎詳細(xì)介紹了DeepSeek-R1-Safe-671B基礎(chǔ)大模型的核心創(chuàng)新。研發(fā)團(tuán)隊(duì)從底層入手,構(gòu)建了一套覆蓋“高質(zhì)量安全語料—平衡優(yōu)化的安全訓(xùn)練—全鏈路自主創(chuàng)新軟硬件平臺”的全流程安全后訓(xùn)練框架。在算力平臺搭建方面,團(tuán)隊(duì)首次實(shí)現(xiàn)基于昇騰千卡算力平臺的千億級參數(shù)滿血版大模型安全訓(xùn)練,系統(tǒng)性地解決了訓(xùn)練環(huán)境中的關(guān)鍵問題,構(gòu)建了服務(wù)器間環(huán)境依賴同步、數(shù)據(jù)與權(quán)重共享、協(xié)同訓(xùn)練推理等一系列開發(fā)工具。目前,模型已在ModelZoo、GitCode、GitHub、Gitee及ModelScope 等多個社區(qū)全面開源。測試結(jié)果表明,DeepSeek-R1-Safe針對有毒有害言論、政治敏感內(nèi)容、違法行為教唆等14個維度的普通有害問題整體防御成功率近100%,針對情境假設(shè)、角色扮演、加密編碼等多個越獄模式整體防御成功率超過40%。其綜合安全防御能力達(dá)83%,在同樣測試設(shè)置下超過Qwen-235B和DeepSeek-R1-671B等多個同期模型8%至15%。此外,在MMLU、GSM8K、CEVAL等通用能力基準(zhǔn)測試中,DeepSeek-R1-Safe相比于DeepSeek-R1的性能損耗在1% 以內(nèi)。這些結(jié)果表明 DeepSeek-R1-Safe不僅顯著提升了安全防護(hù)能力,也保障了模型的可用性,達(dá)成了安全能力與通用性能之間的有效平衡。

浙江大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院院長、區(qū)塊鏈與數(shù)據(jù)安全全國重點(diǎn)實(shí)驗(yàn)室常務(wù)副主任

任奎

隨后的交流討論中,全場與會嘉賓圍繞“AI安全治理框架構(gòu)建”“自主創(chuàng)新生態(tài)開發(fā)者培育”“校企協(xié)同創(chuàng)新機(jī)制優(yōu)化”等話題展開深入探討,一致認(rèn)為該成果為我國突破AI安全技術(shù)壁壘、構(gòu)建自主的智能生態(tài)提供了重要支撐。

據(jù)悉,浙江大學(xué)鯤鵬昇騰科教創(chuàng)新卓越中心自成立以來,始終聚焦“人才培養(yǎng)、系統(tǒng)架構(gòu)創(chuàng)新和賦能交叉學(xué)科”三大核心任務(wù),通過算力資助及專家支持,舉辦特訓(xùn)營、研討會和專業(yè)競賽,已形成“產(chǎn)教融合、科教融匯”的創(chuàng)新模式。此次DeepSeek-R1-Safe基礎(chǔ)大模型的發(fā)布,正是卓越中心模式下的重要成果。未來,雙方將繼續(xù)深化合作,在多模態(tài)安全模型研發(fā)、AI安全測評標(biāo)準(zhǔn)制定等領(lǐng)域持續(xù)攻關(guān),為我國人工智能高質(zhì)量發(fā)展提供堅實(shí)基礎(chǔ)。

分享到

zhupb

相關(guān)推薦