新開源的4 個(gè)模型屬于融合推理模型,具備推理速度快、性價(jià)比高的特點(diǎn),用戶可根據(jù)使用場(chǎng)景靈活選擇模型思考模式——快思考模式提供簡(jiǎn)潔、高效的輸出;而慢思考涉及解決復(fù)雜問題,具備更全面的推理步驟。

效果上,四個(gè)模型均實(shí)現(xiàn)了跟業(yè)界同尺寸模型的對(duì)標(biāo),特別是在語言理解、數(shù)學(xué)、推理等領(lǐng)域有出色表現(xiàn),在多個(gè)公開測(cè)試集上得分達(dá)到了領(lǐng)先水平。

descript
descript

這四個(gè)模型的亮點(diǎn)在于agent和長(zhǎng)文能力,跟此前開源的Hunyuan-A13B模型一樣,技術(shù)上通過精心的數(shù)據(jù)構(gòu)建和強(qiáng)化學(xué)習(xí)獎(jiǎng)勵(lì)信號(hào)設(shè)計(jì),提升了模型在任務(wù)規(guī)劃、工具調(diào)用和復(fù)雜決策以及反思等agent能力上的表現(xiàn),讓模型實(shí)際應(yīng)用中可以輕松勝任深度搜索、excel 操作、旅行攻略規(guī)劃等任務(wù)。

此外,模型原生長(zhǎng)上下文窗口達(dá)到了 256k,意味著模型可以一次性記住并處理相當(dāng)于40萬中文漢字或50萬英文單詞的超長(zhǎng)內(nèi)容,相當(dāng)于一口氣讀完3本《哈利波特》小說 ,并且能記住所有人物關(guān)系、劇情細(xì)節(jié),還能根據(jù)這些內(nèi)容討論后續(xù)故事發(fā)展。

部署上,四個(gè)模型均只需單卡即可部署,部分PC、手機(jī)、平板等設(shè)備可直接接入。并且,模型具有較強(qiáng)的開放性,主流推理框架(例如,SGLang,vLLM and TensorRT-LLM)和多種量化格式均能夠支持。

應(yīng)用層面,四款小尺寸模型都能夠滿足從端側(cè)到云端、從通用到專業(yè)的多樣化需求,并且已經(jīng)在騰訊多個(gè)業(yè)務(wù)中應(yīng)用,可用性和實(shí)用性經(jīng)過了實(shí)踐的檢驗(yàn),是真正實(shí)用的模型。

例如,依托模型原生的超長(zhǎng)上下文能力,騰訊會(huì)議AI小助手、微信讀書AI問書AI助手均實(shí)現(xiàn)對(duì)完整會(huì)議內(nèi)容、整本書籍的一次性理解和處理。

在端側(cè)應(yīng)用上,騰訊手機(jī)管家利用小尺寸模型提升垃圾短信識(shí)別準(zhǔn)確率,實(shí)現(xiàn)毫秒級(jí)攔截,隱私零上傳;騰訊智能座艙助手通過雙模型協(xié)作架構(gòu)解決車載環(huán)境痛點(diǎn),充分發(fā)揮模型低功耗、高效推理的特性。

在高并發(fā)場(chǎng)景中,搜狗輸入法基于模型的多模態(tài)聯(lián)合訓(xùn)練機(jī)制使嘈雜環(huán)境下提升識(shí)別準(zhǔn)確率;騰訊地圖采用多模型架構(gòu),利用意圖分類和推理能力提升了用戶交互體驗(yàn);微信輸入法「問AI」基于模型實(shí)現(xiàn)輸入框與 AI 即問即答的無縫銜接。

在需求各異、約束嚴(yán)苛的垂直行業(yè)應(yīng)用中,金融AI助手通過Prompt優(yōu)化和少量數(shù)據(jù)微調(diào)實(shí)現(xiàn)95%+意圖識(shí)別準(zhǔn)確率,展現(xiàn)出金融級(jí)的高可靠性;游戲翻譯和QQ飛車手游NPC充分利用模型的理解能力在多語言理解能力、方言翻譯和智能對(duì)話方面有突出表現(xiàn),這些能力在專業(yè)客服、內(nèi)容出海甚至電商直播等場(chǎng)景有巨大應(yīng)用潛力。

最近,全球開源領(lǐng)域異常熱鬧,中國大模型表現(xiàn)搶眼。騰訊混元大語言模型也在持續(xù)推進(jìn)開源,參與技術(shù)社區(qū)的共建之中,其開源模型已覆蓋文本、圖像、視頻和3D生成等多個(gè)模態(tài)。

在大語言模型領(lǐng)域,騰訊混元此前陸續(xù)開源了激活參數(shù)量達(dá)52B的Hunyuan large和首個(gè)混合推理MoE模型 Hunyuan-A13B ,這些模型憑借架構(gòu)上的創(chuàng)新以及在性能和效果上的不錯(cuò)表現(xiàn),在開源社區(qū)受到廣泛關(guān)注。

多模態(tài)方面,混元還開放了完整多模態(tài)生成能力及工具集插件,陸續(xù)開源了業(yè)界領(lǐng)先的文生圖、視頻生成和 3D 生成能力,提供接近商業(yè)模型性能的開源基座,方便社區(qū)基于業(yè)務(wù)和使用場(chǎng)景定制,圖像、視頻衍生模型數(shù)量達(dá)到3000 個(gè)。上周,騰訊發(fā)布并開源混元3D世界模型1.0,這一模型一經(jīng)發(fā)布即迅速登上Hugging Face趨勢(shì)榜第二,下載量飆到近9k,混元3D世界模型技術(shù)報(bào)告還拿下了Hugging Face論文熱榜第一。

開源是騰訊混元大模型長(zhǎng)期堅(jiān)持的方向,未來騰訊混元也將不斷提升模型能力,繼續(xù)積極擁抱開源,推出更多尺寸、更多模特的模型,加速產(chǎn)業(yè)落地和應(yīng)用,與開發(fā)者和合作伙伴共建大模型開源生態(tài)。

官網(wǎng)體驗(yàn)地址:騰訊混元

Github:
Hunyuan-0.5B:GitHub – Tencent-Hunyuan/Hunyuan-0.5B
Hunyuan-1.8B:https://github.com/Tencent-Hunyuan/Hunyuan-1.8B
Hunyuan-4B:https://github.com/Tencent-Hunyuan/Hunyuan-4B
Hunyuan-7B:GitHub – Tencent-Hunyuan/Hunyuan-7B: Tencent Hunyuan 7B (short as Hunyuan-7B) is one of the large language dense models of Tencent Hunyuan


HuggingFace:
Hunyuan-0.5B:https://huggingface.co/tencent/Hunyuan-0.5B-Instruct
Hunyuan-1.8B:https://huggingface.co/tencent/Hunyuan-1.8B-Instruct
Hunyuan-4B:https://huggingface.co/tencent/Hunyuan-4B-Instruct
Hunyuan-7B:https://huggingface.co/tencent/Hunyuan-7B-Instruct

分享到

nina

相關(guān)推薦