40萬+小時大數據底座,充分激發(fā)精品音色優(yōu)勢

華為閱讀“精品女聲”音色的音源,是中國傳媒大學視聽技術與智能控制系統(tǒng)文化和旅游部重點實驗室研究員、中國傳媒大學播音主持藝術學院副教授王宇紅。此次為華為閱讀提供的精品聲創(chuàng)新,源于實驗室研發(fā)的“藝術+技術情感體系”。通過破解智能語音交互過程中的多種擬態(tài)情境,該重點實驗室精心錄制了為機器輸入大量高質量語料的數據集,再通過人工智能合成技術將機械聲音比人聲差的情感加上,讓機械聲音也有了人性化的溫度。

微信圖片_20250227150228.jpg

華為閱讀剛剛升級的精品音色3.0采用TTS技術,即Text-to-Speech文字轉語音技術,以華為的語音大模型底座為核心基礎架構,構建和優(yōu)化TTS技術,融合實驗室研發(fā)的“藝術+技術情感體系”,篩選40萬+小時的大數據訓練打底,專家演繹數據強化,形成一套對人類語音的音色、語調、韻律等的精準建模。精品音色3.0將王宇紅副教授作為專業(yè)演播員的音色細節(jié)以技術手段充分保留和還原,帶來韻律豐富、重點突出、識別力強和能展現(xiàn)豐富場境、多種情緒態(tài)度的逼真音色、提高信息傳遞的效率。華為閱讀與中國傳媒大學視聽技術與智能控制系統(tǒng)文化和旅游部重點實驗室的強強聯(lián)合,為用戶帶來身臨其境聆聽國家級水平播音的聽書體驗。

華為閱讀精品音色3.0引領數字閱讀情感化趨勢

王宇紅副教授在為華為閱讀錄制精品聲音時,結合了自身30年的媒體教學、播音實踐工作經驗,遵循數字化時代應該發(fā)揮有聲語言本身的個性化優(yōu)勢原則,兼顧了數字化智能語音的“傳播語境擬態(tài)化”、“音色特征通用性”、“感官體驗交流感”、“閱讀內容通識性”的特點。錄制時吐字清晰、發(fā)音標準、語氣語調豐富多樣,將演播者對文字語言的理解、感受轉化為有助于建構讀者心理體驗的停連、重音、語氣、節(jié)奏,同時兼顧在聲音傳達里建立與用戶的面對面、心貼心的“交流感”,讓精品聲音通過華為閱讀的技術能力轉化為聽書音色后,可以適配不同的讀物需求和聽書場景。無論是開車時需要的送達感、抗干擾性;睡覺前需要的松弛感、伴隨性;兒童讀物需要的親切感、啟智性……都能為華為閱讀用戶帶來了高度擬人化、具有共情能力和風格切換能力的聲音。

目前華為閱讀已經上線精品音色3.0,華為用戶升級HarmonyOS NEXT后,即刻就能在華為閱讀體驗來自中國傳媒大學播音老師的專業(yè)音色。作為一款綜合類閱讀應用,華為閱讀在不斷開拓數字閱讀市場的同時,也將與更多專業(yè)機構、專業(yè)人士合作,探索更多人性化交互體驗。

分享到

songjy

相關推薦