(西湖心辰CEO發(fā)布國內首個端到端語音大模型心辰Lingo)

全球權威咨詢機構IDC分析預測,到2030年,全球智能語音服務市場的價值將達到約731.6億美元,年復合增長率預計將達27%。全球范圍內的科技公司都敏銳地捕捉到了這一領域的增長潛力,紛紛投身智能語音技術的開發(fā),一場全新的人機交互革命正在被點燃。

“心辰Lingo能捕捉到語音中的細微變化,不僅能理解你說了什么,還能理解更想表達什么,真正做到了為AI賦予‘高情商’,使其能夠精準洞察言外之意。這也是西湖心辰作為持續(xù)深耕大模型情商能力又一個重要技術突破?!蔽骱某紺EO醒辰在發(fā)布會現(xiàn)場表示。

據(jù)介紹,心辰Lingo語音大模型的能力在多個領域和中文上進行增強,使得心辰Lingo的中文語音效果,相較GPT4o更為出色。主要有三個技術特征。

一是原生的語音理解。作為端到端模型,心辰Lingo不僅能夠識別語音中的文字信息,還能精確捕捉其他重要特征,如情感、語氣、音調,甚至環(huán)境音,更全面地理解語音內容,從而提供更加自然和生動的交互體驗。二是多種語音風格表達。心辰Lingo可以根據(jù)上下文和用戶指令,自適應調整語音的速度、高低、噪聲強度,并能夠生成對話、歌唱、相聲等多種風格的語音響應,有效提升了模型在不同應用場景下的靈活性和適應性。三是,語音模態(tài)超級壓縮。心辰Lingo采用具有數(shù)百倍壓縮率的語音編解碼器,能夠將語音壓縮至極短的長度,在顯著降低計算和存儲成本的同時幫助模型生成高質量語音內容。

心辰Lingo開放內測預約不到10天,已經有超千家企業(yè)用戶預約測試,包括了教育、金融、醫(yī)療健康、政府與公共服務、媒體與娛樂、零售與商業(yè)服務、制造與工程等八大行業(yè),數(shù)十個實際使用場景。

市場層面對心辰Lingo的應用空間作出了積極反饋。在心理健康咨詢場景下,某醫(yī)院擬運用心辰Lingo的語音技術提供患者心理咨詢和干預,通過AI智能對話系統(tǒng),為患者提供情緒支持,幫助他們應對疾病帶來的心理壓力;在客戶服務與支持場景下,某知名產險企業(yè),希望利用心辰Lingo的語音技術進行客戶服務和外呼,針對退保挽留和續(xù)保挽留等自動外呼場景,通過智能語音系統(tǒng)提高服務效率和客戶滿意度。此外,陪伴領域還涌現(xiàn)出一系列個性化需求,如游戲語音陪伴、社交輔助助手、語音母嬰看護等,這些需求的多樣性和創(chuàng)新性為心辰Lingo提供了廣闊的應用前景。

發(fā)布現(xiàn)場,醒辰透露,西湖心辰即將在10月份發(fā)布基于心辰Lingo進行領域深度訓練的兒童陪伴、心理疏導、 銷售服務3大垂類語音模型,與更多行業(yè)領袖攜手,共同推動AI技術的創(chuàng)新和應用,開啟智能服務的新篇章。

西湖心辰是一家致力于人工智能多模態(tài)大模型技術研究及產業(yè)化應用的創(chuàng)新企業(yè),背靠中國新型研究性大學“西湖大學”。外灘大會期間,西湖心辰創(chuàng)始人藍振忠還獲得了首屆螞蟻InTech科技獎。目前,西湖心辰已獲得湯姆貓、藍馳創(chuàng)投、凱泰資本、百度風投、西湖科創(chuàng)投,西湖教育基金會可持續(xù)發(fā)展平臺等知名機構數(shù)千萬美金投資。

分享到

xiesc

相關推薦