(一)把DeepSeek提升為戰(zhàn)略級目標
目標應(yīng)與用戶的戰(zhàn)略緊密相連,確保AI的建設(shè)為實現(xiàn)整體戰(zhàn)略目標服務(wù)。用戶在建設(shè)AI時,經(jīng)營目標、運營目標和部署目標相互依存,形成一個完整的目標體系。用戶在部署大模型時需要清晰地識別其適用場景與局限,不能一刀切,而應(yīng)制定合理和差異化的目標。因此,了解何時適合采用AI、何時避免使用AI,以及針對特定場景選擇何種AI技術(shù)至關(guān)重要。
DeepSeek大模型的突破性進展,抬高了大模型能力天花板,AI適用場景進一步擴大。它能夠模擬人類專家級的邏輯推演過程,展現(xiàn)出極高的邏輯嚴密性,其核心在于將傳統(tǒng)AI的“規(guī)則響應(yīng)”升級為“認知推演”,這使得AI能夠處理非結(jié)構(gòu)化信息交織的模糊性場景。
當這種接近人類高階思維的能力注入業(yè)務(wù)場景,能力的質(zhì)變直接打破了“AI僅適用于標準化場景”的固有認知,推動應(yīng)用邊界向戰(zhàn)略規(guī)劃、創(chuàng)新設(shè)計等高階領(lǐng)域延伸。
(二)評估現(xiàn)狀,了解AI的落地成熟度
在明確了DeepSeek的戰(zhàn)略目標之后,我們需要了解用戶自身所處的階段,發(fā)現(xiàn)薄弱環(huán)節(jié),并為下一步的建設(shè)方向提供指導(dǎo)。我們主要從4個方面來評估現(xiàn)狀。
1、戰(zhàn)略與場景
要確保用戶內(nèi)部已達成目標的對齊,同時需要優(yōu)先選擇符合戰(zhàn)略目標,并且具備可行性的場景進行實施。
2、數(shù)據(jù)就緒度
AI項目的成功,一定是數(shù)據(jù)驅(qū)動的。無論是傳統(tǒng)AI還是生成式AI,高質(zhì)量的數(shù)據(jù)是AI模型項目的基礎(chǔ)。但對于生成式AI來說,更重要的一點是數(shù)據(jù)的規(guī)模和多樣性。比如DeepSeek R1模型能力強,一方面原因是算法創(chuàng)新,如MLA、強化學(xué)習(xí)等,更重要是數(shù)據(jù)質(zhì)量高、場景覆蓋廣。另外,想要長久保持AI模型的高質(zhì)量服務(wù),還需要不斷采集數(shù)據(jù)、反饋數(shù)據(jù),對模型進行迭代更新。
3、AI項目的落地實施,離不開團隊
需要具備理解業(yè)務(wù)并轉(zhuǎn)化為項目的核心架構(gòu),以及一些工程化的角色,如數(shù)據(jù)標注、清洗、模型訓(xùn)練和調(diào)參、工程優(yōu)化等角色。DeepSeek的優(yōu)異性能,讓越來越多中小企業(yè)可以直接應(yīng)用,進一步降低了工程化團隊的要求,也會使得AI項目落地更加容易。
4、資源就緒度
指的是AI算力,包括計算、存儲、網(wǎng)絡(luò)等,以及為了實施項目所需要的一些基礎(chǔ)框架、開發(fā)工具等,目的是提供對AI全生命周期的支撐。隨著DeepSeek的規(guī)?;瘧?yīng)用,AI行業(yè)重心從訓(xùn)練轉(zhuǎn)向推理,未來推理算力的消耗和供給將會極大增加,推理算力占比將從30%提升到70%,用戶在算力選擇方面也會更加便利。
(三)選擇DeepSeek應(yīng)用場景
如何選擇AI應(yīng)用場景,歸根結(jié)底都是圍繞降本增效、提升體驗和模式創(chuàng)新三個方面來展開的,這些也是各行業(yè)智能化轉(zhuǎn)型的終極目標。
首先關(guān)注戰(zhàn)略匹配度,看是否符合這三個方面的目標,其次是技術(shù)支撐,重點考慮是否是生成式AI的應(yīng)用場景,以及通過哪些技術(shù)路徑來支持場景落地。
另外就是數(shù)據(jù)和AI基礎(chǔ)設(shè)施:數(shù)據(jù)層面,需要具備精標注數(shù)據(jù)、反饋數(shù)據(jù),以及垂類語料(無標注數(shù)據(jù))條件;算力方面提供AI計算支撐;基礎(chǔ)大模型方面,這是應(yīng)用AI的最基礎(chǔ)條件,用戶需要考慮大模型的開源/閉源路線。目前開源路線已得到極大發(fā)展,尤其是DeepSeek生態(tài)已快速形成并在規(guī)?;瘮U張,芯片廠商、云廠商、軟件廠商都在主動接入或適配,未來將會持續(xù)擴張。擁抱DeepSeek是一種更高性價比的選擇。
(四)初步評估可行性
選定場景后,我們需要對某個特定場景進行初步可行性判斷,這個判斷需要業(yè)務(wù)、技術(shù)和工程角色共同參與評估。
業(yè)務(wù)如何判斷呢?DeepSeek的優(yōu)異性能和獲得的便利性,讓我們可以隨時進行場景驗證。例如,業(yè)務(wù)方是合同審核部門,場景是審核合同里的關(guān)鍵內(nèi)容是否缺失,那么可以基于DeepSeek進行初步驗證,輸入一段合同文本,輸出就是幾個關(guān)鍵字段和它的值,而目標就是提取這些信息,并且內(nèi)容沒有丟失。這是沒有任何技術(shù)和工程參與優(yōu)化的結(jié)果。這個工作業(yè)務(wù)團隊是完全可以勝任的,如果讓技術(shù)部門來判斷,可能會存在業(yè)務(wù)知識缺少的情況,無法準確判斷業(yè)務(wù)場景的可行性。
技術(shù)部門則重點關(guān)注基礎(chǔ)模型本身的能力,也就是大模型在預(yù)訓(xùn)練階段基本定型的,主要包括它在預(yù)訓(xùn)練階段用的知識、采用了哪些語言、有沒有用一些帶有邏輯推理的語料。在這些方面,DeepSeek模型也表現(xiàn)出極為出色的能力,尤其是671B滿血版,經(jīng)歷了SFT冷啟動、COT數(shù)據(jù)、GRPO強化學(xué)習(xí)算法及全場景強化學(xué)習(xí)等多個創(chuàng)新點,模型已具備高效及強大的思考能力。
最后是工程角度,在DeepSeek出現(xiàn)之前,使用大模型需要掌握一些Prompt(提示詞)優(yōu)化技巧,有時還需要結(jié)合few shot(示例),以及思維鏈等方式,來激發(fā)大模型本身的能力。而DeepSeek本身已經(jīng)表現(xiàn)出了以接近人類專家的水平的思考過程,這就極大降低了Prompt設(shè)計工作的復(fù)雜程度。
各行業(yè)用戶內(nèi)部,知識問答的需求將會爆發(fā)式增長,因為接入DeepSeek來實現(xiàn)企業(yè)RAG(檢索增強)生成這種方式,整體的工程化落地難度也大大降低,越來越多用戶會開始建設(shè)知識問答應(yīng)用,以服務(wù)內(nèi)部或外部客戶。
同樣的,DeepSeek本身對語言理解能力以及對指令的遵循能力變得更好,所以進行大模型SFT(Supervised Fine-Tun-ing)微調(diào)甚至進行二次預(yù)訓(xùn)練,這種場景將會大幅減少,對其工程化團隊的要求將大幅降低。
(五)準備DeepSeek落地所需資源
在確定初步可行之后,即可開始準備大模型落地所需資源。主要從4個方面準備:與建設(shè)場景相匹配的數(shù)據(jù)、算力、開發(fā)工具和團隊。
1、準備數(shù)據(jù)
根據(jù)選擇場景的不同,需要準備的數(shù)據(jù)也會有很大不同:
RAG場景:文檔預(yù)處理(如文檔格式轉(zhuǎn)換等)、文檔解析(PDF識別,版式識別)、OCR(圖像轉(zhuǎn)文字)、文檔切分(切分為小的片段)、數(shù)據(jù)增強(提取QA、生成摘要)。
大模型微調(diào)場景:對于少數(shù)具備較強AI技術(shù)能力的團隊,在微調(diào)場景需要準備:精標注QA數(shù)據(jù)(問答對形式)、準備指令數(shù)據(jù)(如人設(shè)遵循、輸出格式要求等)。需要確保數(shù)據(jù)準確性(例如做過濾低質(zhì)量,去掉重復(fù)數(shù)據(jù)等)、數(shù)據(jù)多樣性(要能夠覆蓋各種真實應(yīng)用場景)、數(shù)據(jù)一致性(數(shù)據(jù)不沖突)、數(shù)據(jù)增強(生成QA、摘要)等。
二次預(yù)訓(xùn)練場景:這種需求只有在某個垂類領(lǐng)域的頭部企業(yè)才會選擇,包括:專業(yè)領(lǐng)域的語料(如金融、醫(yī)療等專業(yè)術(shù)語,這些領(lǐng)域使用語境等)。需要確保數(shù)據(jù)多樣性(如覆蓋場景種類足夠多)、數(shù)據(jù)規(guī)模足夠大(一般要達到數(shù)十億級token以上)、一定的配比數(shù)據(jù)(增加通用領(lǐng)域數(shù)據(jù)做二次預(yù)訓(xùn)練,如1:1配置)、數(shù)據(jù)處理能力(去除重復(fù)數(shù)據(jù)、低質(zhì)量數(shù)據(jù)、隱私數(shù)據(jù)、不合規(guī)數(shù)據(jù)等)。
2、準備算力
在大模型建設(shè)中,算力的多少決定了訓(xùn)練速度、效率和模型表現(xiàn),是推動模型快速落地的關(guān)鍵資源。那么要準備多大的算力才能滿足實際應(yīng)用需求?這里有一些經(jīng)驗,可以用于快速進行算力數(shù)量估算(此處僅考慮GPU算力)。
對于訓(xùn)練場景,全參微調(diào)所需的總顯存一般為模型參數(shù)量(以B-十億為單位)的20倍,例如70億(7B)參數(shù)大模型,至少需要140G顯存,按照單卡80G顯存,則對應(yīng)的GPU卡至少需要2張。而130億(13B)參數(shù)大模型,至少需要260G顯存,按照單卡80G顯存,則對應(yīng)的GPU卡至少需要4張。
3、準備工具
基礎(chǔ)大模型的選擇,往往決定了應(yīng)用效果的基線。對于大多數(shù)用戶來說,首選是DeepSeek R1系列蒸餾模型,在同等參數(shù)量下,相比其它開源大模型,它能夠取得更好的效果。而在6個蒸餾模型中,32B參數(shù)量大模型能夠在效果和落地成本方面取得較好的平衡,可以作為應(yīng)用首選。
如果是為了解決特定場景下的應(yīng)用目標問題,則需要AI應(yīng)用開發(fā)工具,例如開發(fā)一個RAG應(yīng)用、Agent智能體應(yīng)用等,需要評估應(yīng)用開發(fā)工具對場景效果的支撐。
在模型微調(diào)和部署工具選擇上,基于長遠考慮,首先關(guān)注對資源的利用率和整體性價比,其次需要考慮工具的完整性、兼容性、易用性、可靠性、以及安全性 。例如,在性價比方面,在相同的基礎(chǔ)大模型條件下,平臺對于算力資源消耗和模型服務(wù)性能如何;使用時學(xué)習(xí)門檻是否足夠低,操作是否足夠簡便,過程是否自動化等。
4、搭建團隊
大模型項目更依賴于數(shù)據(jù)驅(qū)動的效果調(diào)優(yōu)、模型微調(diào)和二次預(yù)訓(xùn)練等技術(shù),而傳統(tǒng)系統(tǒng)更關(guān)注業(yè)務(wù)流程的實現(xiàn)與系統(tǒng)的長期穩(wěn)定性。用戶在推動大模型項目落地時,應(yīng)根據(jù)首先落地的場景,來做差異化的團隊配置。
例如,初期只選擇內(nèi)部流程自動化場景,只需要做Prompt優(yōu)化和系統(tǒng)對接就可以,所以在AI團隊上重點配置提示詞優(yōu)化工程師、工程開發(fā)工程師;而在RAG應(yīng)用場景,就需要文檔數(shù)據(jù)預(yù)處理、檢索優(yōu)化等工程師。
(六)分階段實施
階段一:場景為王&運營提效
場景為王,指的是選擇最簡單、最容易做出效果的場景去建設(shè)。當前,基于DeepSeek模型的RAG應(yīng)用正成為各行業(yè)智能化轉(zhuǎn)型的關(guān)鍵突破口。DeepSeek推動大模型技術(shù)逐步走向產(chǎn)業(yè)化規(guī)模化落地,用戶亟需找到投入產(chǎn)出比高、見效快的AI應(yīng)用場景。RAG技術(shù)憑借其“知識檢索+智能生成”的雙重能力,正成為用戶構(gòu)建智能系統(tǒng)的首選方案。
對于希望快速實現(xiàn)AI價值的用戶,建議優(yōu)先選擇知識密集度高、流程標準化強的場景切入,例如技術(shù)文檔問答或產(chǎn)品知識庫建設(shè)。通過小步快跑的方式,用戶可在3個月內(nèi)看到明顯的效率提升,為后續(xù)更復(fù)雜的AI應(yīng)用奠定基礎(chǔ)。在實施過程中,要特別注意建立知識更新閉環(huán),持續(xù)優(yōu)化檢索策略和生成質(zhì)量,最終形成具有特色的智能知識中樞。
相較于其它通用大模型,DeepSeek模型在構(gòu)建企業(yè)RAG(檢索增強生成)應(yīng)用中的優(yōu)勢不僅體現(xiàn)在成本降低和技術(shù)性能提升,更能通過開源生態(tài)為用戶提供從基礎(chǔ)應(yīng)用到深度智能的全鏈路支持。
例如推理成本降低,DeepSeek在復(fù)雜推理任務(wù)(如金融研報生成)中實現(xiàn)了70%的成本降低。其蒸餾模型(如DeepSeek-R1)在更小規(guī)模下仍能保持高性能,減少了對高端計算資源的依賴;
長思維鏈與自我驗證,通過強化學(xué)習(xí)和模型蒸餾技術(shù),DeepSeek能在小參數(shù)模型中實現(xiàn)長推理鏈與自我驗證,滿足用戶對復(fù)雜場景的高準確率要求;
開源商用授權(quán),DeepSeek模型提供開源商用授權(quán)政策,用戶可免費用于微調(diào)、量化及衍生開發(fā),降低技術(shù)門檻和法律風(fēng)險。
以知識庫檢索問答(RAG)方案為例,用戶正將AI應(yīng)用從單點工具升級為全域知識中樞。某處于裝備制造產(chǎn)業(yè)鏈下游的傳統(tǒng)型企業(yè),需要對接上千家上游元器件供應(yīng)商。企業(yè)有數(shù)百名產(chǎn)品設(shè)計人員,主要工作是結(jié)合工藝參數(shù)的需求,進行物料選型,再給后續(xù)環(huán)節(jié)使用。
物料總計有3000余個,對應(yīng)1萬多份物料技術(shù)規(guī)范書文檔。員工通過手動整理參數(shù)表格并結(jié)合人工核對來完成物料篩選,完成一個場景的物料選型往往需要數(shù)天時間,嚴重影響生產(chǎn)效率。當Deepseek出現(xiàn)后,用戶可以通過對話的方式,讓大模型準確回答其所需要的物料,使得整個過程縮短到分鐘級,準確率達到90%以上。用戶借助該能力中樞,正嘗試對多個內(nèi)部業(yè)務(wù)系統(tǒng)進行智能提效,如應(yīng)用于研發(fā)、生產(chǎn)、供應(yīng)鏈、銷售、售后服務(wù)系統(tǒng)等,大幅提升效率和競爭力。
另外需要注意的是,在企業(yè)級RAG應(yīng)用上線后,需同步進行運營提效工作,持續(xù)收集場景反饋數(shù)據(jù),對落地場景效果持續(xù)優(yōu)化,才能在初始落地階段產(chǎn)生明顯價值。
階段二:場景擴展
基于第一階段的成功,用戶要深入到核心業(yè)務(wù)場景去解決復(fù)雜的場景問題,發(fā)揮AI的價值,從輔助性角色變成核心角色。例如銷售機器人、個性化服務(wù)機器人、運維機器人等。這個階段的特點是復(fù)雜度更高,往往不是單靠大模型能完成的,需要借助小模型、智能體等來協(xié)作完成。
階段三:持續(xù)優(yōu)化
不管是什么樣的AI模型,部署后,其固有知識相對不會變化,但業(yè)務(wù)場景不是一成不變的,如果不持續(xù)優(yōu)化模型,它的效果會持續(xù)衰減。另外,隨著落地的場景越來越多,并發(fā)量越來越大,它所消耗的資源也成倍增加,如果不對它的底層資源進行優(yōu)化,后續(xù)將有非常大的成本支出。
綜上,我們可以通過不斷采集、反饋、優(yōu)化,形成數(shù)據(jù)閉環(huán),來持續(xù)對場景做提效。構(gòu)建數(shù)據(jù)反饋閉環(huán)是確保企業(yè)大模型適應(yīng)業(yè)務(wù)變化的基礎(chǔ),優(yōu)化后的模型重新部署到業(yè)務(wù)場景中,繼續(xù)收集新的數(shù)據(jù),形成持續(xù)反饋的閉環(huán)。這不僅讓模型適應(yīng)業(yè)務(wù)的變化,還能不斷提高其在核心場景中的應(yīng)用效果。
階段四:賦能核心業(yè)務(wù)
這是AI落地的終極目標,AI大量融入到關(guān)鍵業(yè)務(wù)鏈條中,深入核心業(yè)務(wù),比如制造業(yè)的研產(chǎn)供銷服等環(huán)節(jié)。未來,用戶的AI建設(shè)不斷深入,將會覆蓋到全部鏈條,例如——
在研發(fā)板塊,可以充分利用大模型的理解以及調(diào)用外部工具、生成代碼的能力,輔助進行產(chǎn)品工藝設(shè)計和參數(shù)選擇;
在生產(chǎn)板塊,可以通過語音自然語言交互,對機器人進行操作;
在銷售板塊,大模型結(jié)合數(shù)字人,能夠為用戶提供更好的體驗和服務(wù)響應(yīng);
在設(shè)備運維方面,能夠及時給出設(shè)備故障的維修方案;
在運營方面,通過大模型提供個性化的數(shù)據(jù)分析和運營報告。
……
(七)評估
對大模型項目建設(shè)評估不僅是對一次項目執(zhí)行結(jié)果的評估,更是對階段性工作的評估,包括但不僅限于項目業(yè)務(wù)價值、用戶體驗、成本效益、模型性能與合規(guī)性、安全性等多個維度的綜合評估。通過建立持續(xù)的監(jiān)控與反饋機制,優(yōu)化運營成本,分析模型的擴展?jié)摿?并結(jié)合未來發(fā)展戰(zhàn)略,用戶可進一步確保大模型項目的成功和長期價值。
(八)持續(xù)運營
只有堅持長期在數(shù)據(jù)和場景方面的運營深耕,才有助于構(gòu)建持續(xù)競爭優(yōu)勢,這個過程可重點關(guān)注數(shù)據(jù)飛輪持續(xù)化和場景運營精細化。
1、數(shù)據(jù)飛輪持續(xù)化:
整合多源數(shù)據(jù)(銷售、客服、供應(yīng)鏈……),統(tǒng)一數(shù)據(jù)質(zhì)量標準,設(shè)置專門的數(shù)據(jù)治理團隊;
設(shè)置模型效果評估標準(基于標準測試集和基于業(yè)務(wù)反饋結(jié)果);
收集線上/線下反饋數(shù)據(jù);
關(guān)鍵指標監(jiān)控(性能指標、業(yè)務(wù)指標,如轉(zhuǎn)化率、復(fù)購率);
明確實施微調(diào)優(yōu)化的準入標準;
通過持續(xù)的數(shù)據(jù)積累、數(shù)據(jù)反饋閉環(huán),推動模型的不斷優(yōu)化和迭代。
2、場景運營精細化:
一把手牽頭,發(fā)動各個業(yè)務(wù)部門梳理業(yè)務(wù)場景,細化到最小粒度場景;
對全量場景做價值度評估,排優(yōu)先級;
建立業(yè)務(wù)部門和AI團隊的場景對接機制,明確場景提出-評估-立項/關(guān)閉-建設(shè)-評估-運營的整個閉環(huán);
建立效果評估機制,對用戶反饋做閉環(huán)跟蹤;
挖掘新場景,鼓勵內(nèi)部做業(yè)務(wù)場景與AI結(jié)合的創(chuàng)新。
在這場由DeepSeek引發(fā)的智能化浪潮中,各行業(yè)用戶的數(shù)字化轉(zhuǎn)型路徑都在發(fā)生變化,深信服將在這場變革中,助力用戶更順利地實現(xiàn)AI+云化升級。