騰訊云TI平臺(tái)限時(shí)免費(fèi)開(kāi)放DeepSeek的在線體驗(yàn)功能,支持 DeepSeek-R1 和 DeepSeek-R1-Distill-Qwen-1.5B 兩款模型,便于開(kāi)發(fā)者直觀比較“最大杯”和“最小杯”的性能差異。進(jìn)入DeepSeek系列模型頁(yè)面后,選擇上方Tab即可進(jìn)入在線對(duì)話體驗(yàn)頁(yè)面。
用戶還可以使用同一問(wèn)題對(duì)上述兩款模型進(jìn)行簡(jiǎn)單對(duì)比測(cè)試。比如提問(wèn):“在我的廚房里,有一張桌子,上面放著一個(gè)杯子,杯子里有一個(gè)球。我把杯子移到了臥室的床上,并將杯子倒過(guò)來(lái)。然后,我再次拿起杯子,移到了主房間?,F(xiàn)在,球在哪里?”
DeepSeek-R1-Distill-Qwen-1.5B 的回答:
DeepSeek-R1的回答:
從回答對(duì)比可以看出,擁有更大參數(shù)量的DeepSeek-R1模型在效果上更勝一籌,其正確推理出了杯子倒扣時(shí)球會(huì)掉出并留在臥室的床上,不會(huì)隨著杯子移動(dòng)至主房間。而參數(shù)量較小的DeepSeek-R1-Distill-Qwen-1.5B模型認(rèn)為球仍在原來(lái)的桌子中。
對(duì)于復(fù)雜任務(wù)而言,擁有更大參數(shù)量的R1模型會(huì)更有優(yōu)勢(shì),但推理成本也會(huì)更高。更小參數(shù)的R1-Distill系列模型,響應(yīng)速度更快,推理成本也會(huì)更低,在處理較為簡(jiǎn)單的任務(wù)時(shí)仍是不錯(cuò)的選擇。
對(duì)于需要將DeepSeek接入AI應(yīng)用的開(kāi)發(fā)者,TI平臺(tái)提供一鍵部署功能,可快速將DeepSeek發(fā)布為推理服務(wù)。進(jìn)入DeepSeek系列模型頁(yè)面后,選擇點(diǎn)擊上方的“新建在線服務(wù)”按鈕,將會(huì)自動(dòng)跳轉(zhuǎn)至“在線服務(wù)”模塊,發(fā)起模型部署。平臺(tái)支持多種計(jì)費(fèi)模式:
l 按量計(jì)費(fèi):對(duì)于僅需短時(shí)體驗(yàn)的用戶,可以直接從TIONE購(gòu)買算力,并選用“按量計(jì)費(fèi)”模式;
l 包年包月:對(duì)于已購(gòu)買CVM機(jī)器或需要長(zhǎng)時(shí)間體驗(yàn)的用戶,推薦選用自有的CVM機(jī)器作為推理算力。
在算力配置方面,“滿血版”DeepSeek-R1總參數(shù)量高達(dá)671B,推薦使用騰訊云上的2臺(tái)8卡HCCPNV6機(jī)型進(jìn)行服務(wù)部署,以獲得穩(wěn)定業(yè)務(wù)體驗(yàn)。蒸餾后的DeepSeek-R1-Distill-Qwen-1.5B模型參數(shù)量為1.5B,單張中端GPU卡即可部署服務(wù)。開(kāi)發(fā)者可根據(jù)業(yè)務(wù)復(fù)雜度選擇合適的模型進(jìn)行測(cè)試。
開(kāi)發(fā)者在TI平臺(tái)完成模型部署后,可在線體驗(yàn)?zāi)P托Ч脚_(tái)也支持以調(diào)用API的方式接入AI應(yīng)用。
詳細(xì)部署和測(cè)試可參考TI平臺(tái)官網(wǎng)提供的實(shí)踐教程:
https://cloud.tencent.com/document/product/851/115962
在部署服務(wù)之外,騰訊云TI平臺(tái)為用戶提供從數(shù)據(jù)處理、模型訓(xùn)練、模型評(píng)測(cè)到模型部署的全流程支持,內(nèi)置多種訓(xùn)練方式和算法框架,可以滿足不同 AI 應(yīng)用場(chǎng)景的需求。
在數(shù)據(jù)處理層面,騰訊云TI平臺(tái)沉淀了來(lái)自騰訊優(yōu)圖實(shí)驗(yàn)室的算法專家清洗大模型訓(xùn)練數(shù)據(jù)的優(yōu)質(zhì)Pipeline,支持開(kāi)箱即用。TI平臺(tái)面向大語(yǔ)言模型和多模態(tài)大模型的標(biāo)注工具非常靈活,基于數(shù)據(jù)集 Schema,可完全自定義工作臺(tái),支持的大模型標(biāo)注場(chǎng)景涵蓋所有文生文、圖生文類的場(chǎng)景。
在精調(diào)訓(xùn)練階段,騰訊云TI平臺(tái)內(nèi)置了主流開(kāi)源模型,用戶可以一鍵發(fā)起精調(diào)任務(wù)。通過(guò)硬件容錯(cuò)、容器調(diào)度、任務(wù)斷點(diǎn)續(xù)訓(xùn)的三層保障機(jī)制,平臺(tái)確保大規(guī)模訓(xùn)練任務(wù)的穩(wěn)定性。另外,借助騰訊自研的Angel加速機(jī)制,騰訊云TI平臺(tái)整體提升了訓(xùn)練性能30%,不僅加快了大模型的精調(diào)過(guò)程,還有效降低了資源消耗。
在模型驗(yàn)證階段,騰訊云TI平臺(tái)還提供了一整套完善的模型評(píng)測(cè)工具,包括在線輕量體驗(yàn)、客觀評(píng)測(cè)以及主觀評(píng)測(cè)。這些評(píng)測(cè)功能讓企業(yè)能夠根據(jù)實(shí)際業(yè)務(wù)需求,對(duì)模型效果進(jìn)行全方位的驗(yàn)證,確保在應(yīng)用場(chǎng)景中的高效表現(xiàn)。
與此同時(shí),騰訊云TI平臺(tái)已完成對(duì)國(guó)產(chǎn)計(jì)算卡的適配,有效滿足了相關(guān)企業(yè)對(duì)安全性和獨(dú)立性的高標(biāo)準(zhǔn)要求。TI平臺(tái)最新支持異構(gòu)算力的統(tǒng)一納管,實(shí)現(xiàn)了ARM架構(gòu)和X86架構(gòu)芯片服務(wù)器算力資源可通過(guò)一個(gè)控制臺(tái)進(jìn)行統(tǒng)一納管,在算力資源緊張的情況下,幫助客戶最大限度整合現(xiàn)有資源。
目前,騰訊云TI平臺(tái)已經(jīng)在金融、出行、政務(wù)、醫(yī)療、工業(yè)、零售等多個(gè)行業(yè)落地應(yīng)用。通過(guò)優(yōu)化AI 模型生產(chǎn)流程、提升 AI 業(yè)務(wù)運(yùn)營(yíng)效率,幫助企業(yè)實(shí)現(xiàn)降本增效。比如某自動(dòng)駕駛企業(yè)借助騰訊云TI平臺(tái),基于數(shù)百?gòu)?GPU 卡實(shí)現(xiàn)了穩(wěn)定高效的自駕感知模型訓(xùn)練,整體訓(xùn)練性能實(shí)測(cè)提升近40%。