騰訊云副總裁、騰訊云智能負(fù)責(zé)人、騰訊優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲介紹,“殷契行止”在字符分類、字形匹配等關(guān)鍵任務(wù)上顯著優(yōu)于通用大模型,其核心優(yōu)勢(shì)來自三方面的技術(shù)創(chuàng)新:針對(duì)甲骨文特征定制的算法算子、基于學(xué)術(shù)知識(shí)庫的閉環(huán)推理機(jī)制,以及高質(zhì)量的多模態(tài)語料支撐。

騰訊優(yōu)圖實(shí)驗(yàn)室聯(lián)合廈門大學(xué)人工智能研究院、甲骨文信息處理實(shí)驗(yàn)室,以 AI + 多模態(tài)語料融合為基礎(chǔ),研發(fā)出多項(xiàng)關(guān)鍵技術(shù),包括字形檢測(cè)與分類算法、AI 摹本生成與字形匹配技術(shù)、甲骨校重與結(jié)構(gòu)化比對(duì)算法,以及融合圖像、文字與語義的多模態(tài)推理能力。這些針對(duì)性算法的引入,使得 AI 首次具備了“理解古文字”的能力,有效解決了通用模型在專業(yè)領(lǐng)域中的適配難題。

在算法突破之外,“殷契行止”還建立了基于知識(shí)庫驗(yàn)證的閉環(huán)推理機(jī)制,確保 AI 釋讀結(jié)果的專業(yè)性與準(zhǔn)確性。其背后依托的是全球規(guī)模最大的甲骨文 AI 研究語料體系,由安陽師范學(xué)院甲骨文信息處理教育部重點(diǎn)實(shí)驗(yàn)室提供學(xué)術(shù)支撐,涵蓋 4184 個(gè)字頭釋義與字形信息、1.5 萬片甲骨多模態(tài)數(shù)據(jù)(包括拓片、摹本與 3D 模型)、143 萬字形數(shù)據(jù)庫與 7 萬拓片樣本,以及超過 3000 篇研究論文與 8 萬篇釋文資料。這一龐大的語料體系為智能體提供了堅(jiān)實(shí)的數(shù)據(jù)與知識(shí)基礎(chǔ),也成為全球古文字 AI 研究的重要開放資源。

憑借這些技術(shù)突破,“殷契行止”不僅讓甲骨文破譯提速,更讓古文字走出象牙塔,進(jìn)入更廣闊的公眾視野。該智能體主要聚焦研究與文化普及中的高頻場(chǎng)景,支持甲骨單字識(shí)別、字形檢索、釋讀查詢、摹本生成與拓片重見檢索等核心功能。用戶只需上傳一張甲骨圖片,AI 即可完成文字識(shí)別、釋義查詢、文獻(xiàn)溯源和數(shù)字摹本生成,實(shí)現(xiàn)從學(xué)術(shù)研究到文化體驗(yàn)的完整閉環(huán)。對(duì)于研究者而言,它顯著縮短了資料收集與比對(duì)時(shí)間;對(duì)于公眾而言,通過微信小程序“了不起的甲骨文”,人們可以輕松體驗(yàn)甲骨識(shí)讀的樂趣,讓千年前的文明真正“活”在掌心。

“殷契行止”的推出,是騰訊及眾多伙伴三年技術(shù)攻堅(jiān)的成果結(jié)晶。過去三年間,騰訊 SSV 數(shù)字文化實(shí)驗(yàn)室聯(lián)合騰訊優(yōu)圖實(shí)驗(yàn)室、騰訊云智能以及安陽師范學(xué)院、廈門大學(xué)人工智能研究院等科研機(jī)構(gòu),持續(xù)探索“AI 助力甲骨文破譯與數(shù)字回歸”的新路徑,發(fā)布了全球首個(gè)甲骨文多模態(tài)數(shù)據(jù)集和最大單字?jǐn)?shù)據(jù)庫,構(gòu)建全球首個(gè)甲骨文 AI 協(xié)同平臺(tái),并推出甲骨文專家智能體,大幅提升了查找文字、實(shí)物和文獻(xiàn)的效率——原本需要五天的資料檢索,如今五分鐘即可完成。相關(guān)研究成果還在 CVPR 2025 和 ICCV 2025 等全球頂級(jí) AI 學(xué)術(shù)會(huì)議上發(fā)表,并獲得多項(xiàng)技術(shù)專利,為甲骨文研究按下“加速鍵”。

“殷契行止”的發(fā)布,不僅是 AI 技術(shù)在文化遺產(chǎn)保護(hù)領(lǐng)域的又一次突破,也代表了騰訊“讓 AI 守護(hù)文化,讓文化啟發(fā) AI”的理念實(shí)踐。正如吳運(yùn)聲所言,AI 的價(jià)值不只是重建語言,更是重建人類與歷史的連接。從殷墟甲骨到云端智能,從殼上考古到數(shù)字復(fù)原,AI 正在讓沉睡千年的文字再次煥發(fā)全新生命力。

分享到

zhupb

相關(guān)推薦