作為一年一度的人工智能盛會,本屆開發(fā)者節(jié)以“萬物智聯(lián) 生生不息——解放生產(chǎn)力,釋放想象力”為主題。

這次的盛會上,科大訊飛曬出了全科成績單,場景覆蓋了汽車、醫(yī)療、教育等,甚至在許多“科目”中得到了第一名。

訊飛星火4.0 Turbo七大能力全面超GPT-4 Turbo

從追趕到引領(lǐng)   國產(chǎn)大模型逆風(fēng)發(fā)力

從2022年ChatGPT爆火,到今年諾貝爾物理學(xué)獎(jiǎng)授予AI先驅(qū),通用人工智能迎來黃金期。具體到技術(shù)層面,Sora、GPT4-o的發(fā)布驗(yàn)證了大模型在多模的成功應(yīng)用;OpenAI o1系列模型進(jìn)一步提升復(fù)雜任務(wù)和專業(yè)領(lǐng)域天花板。

通用人工智能的潛能不斷被印證,也不斷被刷新。但與此同時(shí),目前通用大模型從“可用”到“好用”仍面臨三個(gè)主要挑戰(zhàn):

首先是大模型的可信可解釋問題,其次是端到端等新框架推廣性問題,最后是大模型個(gè)性化“最后一公里”問題。

通過利用高質(zhì)量數(shù)據(jù)以及反向?qū)R技術(shù),訊飛星火此次帶來全新的底層技術(shù)突破,優(yōu)化這些問題的同時(shí),不斷提升大模型應(yīng)用落地效果。

據(jù)劉慶峰介紹,訊飛星火4.0 Turbo全新升級,七大能力全面超過GPT-4 Turbo,數(shù)學(xué)能力、代碼能力超過GPT-4o(Open AI最新一代GPT模型)。此外,星火4.0 Turbo效率相對提升50%。

在數(shù)學(xué)能力上,訊飛星火已完成超長思維鏈、樹搜索和自我反思評價(jià)等算法驗(yàn)證,預(yù)計(jì)今年底可實(shí)現(xiàn)類o1的高難度數(shù)學(xué)能力顯著提升。

與GPT 4o、Claude 3.5 Sonnet、Genmini1.5 pro等國際同行對比,星火4.0 Turbo在國內(nèi)外中英文14項(xiàng)主流測試集上,實(shí)現(xiàn)了9項(xiàng)9項(xiàng)第一。

星火超擬人數(shù)字人,表情動作媲美真人

在1024現(xiàn)場,超擬人數(shù)字人能力正式發(fā)布!

科大訊飛首發(fā)的多模態(tài)視覺交互和超擬人虛擬人交互,可謂是現(xiàn)場最震撼的底座升級看點(diǎn)之一。

要知道,這種語音、視覺、虛擬人交互的「三合一」,屬于業(yè)內(nèi)首發(fā)。在多模態(tài)技術(shù)路線中,科大訊飛儼然已處于業(yè)內(nèi)領(lǐng)先地位。

據(jù)了解,星火超擬人數(shù)字人在業(yè)界率先實(shí)現(xiàn)語義貫穿的“口唇-表情-動作”的超擬人數(shù)字人生成??拼笥嶏w副總裁、研究院院長劉聰現(xiàn)場進(jìn)行了真機(jī)演示,超擬人數(shù)字人可以展現(xiàn)出目瞪口呆、賣萌的表情,實(shí)時(shí)與用戶實(shí)現(xiàn)交流。

星火超擬人數(shù)字人還可識別、分辨面霜、酒、模型、植物等物品,不僅能介紹產(chǎn)品、還能為用戶進(jìn)行推薦,實(shí)現(xiàn)哪里不會拍哪里。劉聰演示過程中,在桌子上擺了孫悟空、奧特曼、怪獸的玩偶,超擬人數(shù)字人直接根據(jù)玩偶的站位變化,講述了一個(gè)生動的故事。

據(jù)悉,星火超擬人數(shù)字人還支持個(gè)性創(chuàng)建,僅需一張照片即可打造自己的數(shù)字分身,用戶可自定義數(shù)字人的性格、介紹、聲音等個(gè)性化設(shè)定。

科大訊飛表示,一句語音即可實(shí)現(xiàn)聲音復(fù)刻,支持多種身份、性格、場景的人設(shè)打造,人設(shè)類型已超1300多種。目前,超擬人數(shù)字人能力已正式開通內(nèi)測,所有開發(fā)者和行業(yè)人士可申請使用。

聯(lián)合華為共研小藝,解決語障問題

科大訊飛和華為聯(lián)合研發(fā)了小藝聲音修復(fù),能讓特殊人群的發(fā)音更加清晰,實(shí)現(xiàn)正常交流。

硬件方面,科大訊飛基于翻譯技術(shù)打造的多語種AI翻譯透明屏,能幫助用戶通過這塊透明顯示屏實(shí)現(xiàn)無障礙交流。

大模型賦能民生剛需:發(fā)布教育、醫(yī)療、司法、政務(wù)等領(lǐng)域AI助手

在教育行業(yè),首次發(fā)布基于“問題鏈”的高中數(shù)學(xué)智能教師系統(tǒng)。

劉慶峰介紹,搭載了高中數(shù)學(xué)智能教師系統(tǒng)的星火智慧黑板2.0將于10月25日在第84屆教育裝備展上正式發(fā)布,從AI均衡視聽更公平、AI教學(xué)工具更高效、AI教師助手更智慧、全國產(chǎn)化算力更安全四個(gè)方面,推動黑板從板書工具躍遷為教學(xué)AI助手。

此外,訊飛AI學(xué)習(xí)機(jī)中首發(fā)AI作業(yè)過濾器。學(xué)習(xí)機(jī)通過OCR能力對紙質(zhì)練習(xí)題進(jìn)行識別,根據(jù)學(xué)生歷史學(xué)習(xí)情況和本地化考情,將題目分出“必做題”“選做題”“建議不做題”三個(gè)等級,為學(xué)生做習(xí)題時(shí)提供“優(yōu)先級”選項(xiàng),以實(shí)現(xiàn)“練得更少、學(xué)得更好”的目標(biāo)。 

訊飛星火醫(yī)療大模型2.0實(shí)現(xiàn)了六大核心場景能力升級,包括醫(yī)療海量知識問答、醫(yī)療復(fù)雜語言理解、醫(yī)療診斷治療推薦、醫(yī)療專業(yè)文書生成、醫(yī)療多輪交互、醫(yī)療多模態(tài)交互。

在細(xì)分的醫(yī)學(xué)影像方面,目前圍繞醫(yī)學(xué)影像的診斷治療,存在影像科醫(yī)生數(shù)量相對不足、拍片質(zhì)量參差不齊、重復(fù)影像檢查發(fā)生率達(dá)到41.82%的問題。

基于訊飛星火醫(yī)學(xué)影像大模型打造的智能醫(yī)學(xué)影像助手也正式發(fā)布。在智能質(zhì)控環(huán)節(jié),智能醫(yī)學(xué)影像助手可幫助影像技師快速評估圖像質(zhì)量,及時(shí)糾正檢查問題;在智能診斷環(huán)節(jié),可以幫助影像醫(yī)師快速生成診斷報(bào)告,解釋溯源并多期對比;在智能讀片環(huán)節(jié),可接入醫(yī)學(xué)影像大模型,通過相關(guān)問答,幫助臨床醫(yī)師制定診療方案。

會上,訊飛醫(yī)療還聯(lián)合安徽省衛(wèi)生健康委員會、認(rèn)知智能全國重點(diǎn)實(shí)驗(yàn)室,共同發(fā)布了全譜系全模態(tài)醫(yī)學(xué)影像大模型開放合作計(jì)劃,旨在匯聚全球最頂尖的影像AI科研團(tuán)隊(duì),共同推進(jìn)醫(yī)學(xué)影像大模型的發(fā)展。

在司法場景,法律大模型賦能庭審筆錄制作、裁判文書編寫、法條類案檢索等司法場景,和星火通用大模型相比,效率提升從61.7%升到87.9%。

在政務(wù)服務(wù)場景,政務(wù)大模型持續(xù)迭代,全面覆蓋4500多種標(biāo)準(zhǔn)化事項(xiàng)和60多種材料,老百姓和政務(wù)大模型“聊天”就能實(shí)現(xiàn)邊聊邊確認(rèn)辦事意圖,審核時(shí)間縮短80%,登記效率提升5倍。此外,發(fā)布會上首發(fā)了搭載政務(wù)大模型的“星火智辦一體機(jī)”,方便群眾從“問著辦”到“領(lǐng)著辦”。

結(jié)語

科大訊飛自成立之初便致力于人工智能領(lǐng)域的研究與發(fā)展,通過不斷的技術(shù)創(chuàng)新和市場拓展,已經(jīng)成長為全球領(lǐng)先的智能語音和人工智能公眾公司,其影響力遍及教育、醫(yī)療、金融等多個(gè)行業(yè)。未來,隨著人工智能技術(shù)的不斷發(fā)展和應(yīng)用,不僅是科大訊飛,將會有更多大模型廠商為全球用戶帶來更多創(chuàng)新和價(jià)值。(文/宋雨涵)

分享到

lixiangjing

算力豹主編

相關(guān)推薦