
字節(jié)推語(yǔ)音生成模型Seed-TTS 擅長(zhǎng)感情控制,聲音與真人無(wú)異
這篇文章介紹了字節(jié)跳動(dòng)團(tuán)隊(duì)提出的新型語(yǔ)音生成模型Seed-TTS,該模型基于自回歸Transformer架構(gòu),具有極高的語(yǔ)音質(zhì)量和表現(xiàn)力,難以區(qū)分與人類(lèi)語(yǔ)音的差異。它在情感控制、小說(shuō)配音和跨語(yǔ)言?xún)?nèi)容創(chuàng)作等方面表現(xiàn)出色,通過(guò)自我蒸餾和強(qiáng)化學(xué)習(xí)...