圖:村上隆首場(chǎng)中國(guó)直播,火山同傳提供實(shí)時(shí)智能同傳字幕
本場(chǎng)直播中,火山引擎旗下的火山同傳產(chǎn)品獨(dú)家全程提供了實(shí)時(shí)智能同傳字幕,通過(guò)深厚的技術(shù)實(shí)力和穩(wěn)定的產(chǎn)品服務(wù),給中國(guó)觀眾帶來(lái)了流暢的跨國(guó)直播體驗(yàn)。
火山同傳對(duì)外首秀 打造“影院級(jí)字幕”
在傳統(tǒng)會(huì)議、直播場(chǎng)景中,機(jī)器翻譯解決方案提供的字幕通常是“打字級(jí)字幕”,觀看這種字幕,觀眾需要投入很大的精力在瀏覽和理解字幕上,觀眾體驗(yàn)非常差。原因有兩個(gè):一是“打字級(jí)字幕”全程會(huì)不停跳動(dòng),觀眾的視線無(wú)法聚焦,容易造成視覺(jué)疲勞。另一個(gè),每句字幕的停留時(shí)間過(guò)短,觀眾往往來(lái)不及看完就會(huì)跳到下一句。
圖:火山同傳“影院級(jí)字幕”,流暢穩(wěn)定
圖:傳統(tǒng)“打字級(jí)字幕”,頻繁跳動(dòng)
為了提升用戶(hù)體驗(yàn),此次村上隆的跨國(guó)直播中,火山同傳創(chuàng)新性地推出了“影院級(jí)字幕”方案,與視頻流整合后流暢地輸出完整的譯文語(yǔ)句,在屏幕上逐句顯示。觀眾可以清楚看到精準(zhǔn)的字幕結(jié)果,免受字幕跳動(dòng)帶來(lái)的視覺(jué)干擾。
在本次村上隆的跨國(guó)直播中,火山同傳的“影院級(jí)字幕”方案就引起了觀眾們的好奇和質(zhì)疑。在彈幕里,就有個(gè)別觀眾質(zhì)疑真的是否在直播。
圖:村上隆直播中的字幕吸引了關(guān)注
火山同傳產(chǎn)品經(jīng)理表示:“這種質(zhì)疑在我們看來(lái),是對(duì)我們的肯定。為了實(shí)現(xiàn)‘影院級(jí)字幕’效果,并在直播中保證‘音畫(huà)字同步’,火山同傳準(zhǔn)備了一套延時(shí)字幕方案?!?br>
該方案中,音頻被推送到主控端完成機(jī)器同傳后,人工利用直播的推拉流延時(shí)時(shí)間,在機(jī)器同傳的結(jié)果上進(jìn)行內(nèi)容校對(duì),以保證投屏字幕的強(qiáng)可讀性。之后,火山同傳的畫(huà)面延時(shí)功能,能夠保證校對(duì)后的字幕在延時(shí)結(jié)束后準(zhǔn)時(shí)送出,與延時(shí)后的畫(huà)面整合并同步推流到觀眾端,最終呈現(xiàn)出添加了高質(zhì)量字幕的直播畫(huà)面。
保證一場(chǎng)專(zhuān)業(yè)直播同傳字幕質(zhì)量的關(guān)鍵是定向的技術(shù)優(yōu)化。字節(jié)跳動(dòng)杰出科學(xué)家、人工智能實(shí)驗(yàn)室總監(jiān)李磊介紹,在村上隆的直播中,火山翻譯團(tuán)隊(duì)除了采用前沿的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù)進(jìn)行模型訓(xùn)練外,還針對(duì)直播場(chǎng)景引入了領(lǐng)域適應(yīng)技術(shù),將村上隆以往的訪談和演講數(shù)據(jù)用于優(yōu)化算法,并對(duì)口語(yǔ)規(guī)范化、專(zhuān)業(yè)術(shù)語(yǔ)定制都進(jìn)行了特殊優(yōu)化處理,確保最終呈現(xiàn)的字幕能夠簡(jiǎn)潔、精準(zhǔn)。
百項(xiàng)專(zhuān)利、50余篇學(xué)術(shù)論文 打造專(zhuān)業(yè)翻譯產(chǎn)品矩陣
火山同傳“影院級(jí)字幕”的背后,是火山翻譯團(tuán)隊(duì)超過(guò)40位頂尖科學(xué)家、工程師打磨出的機(jī)器翻譯模型。
火山翻譯由字節(jié)跳動(dòng)計(jì)算機(jī)研究科學(xué)家、工程師、產(chǎn)品經(jīng)理、產(chǎn)品運(yùn)營(yíng)和語(yǔ)言專(zhuān)家組成的專(zhuān)業(yè)團(tuán)隊(duì)研發(fā),擁有包括火山同傳、火山翻譯API、火山翻譯Studio、瀏覽器翻譯助手等在內(nèi)的一系列矩陣產(chǎn)品。
目前,火山翻譯已支持超過(guò)50個(gè)語(yǔ)種的全語(yǔ)向互譯,應(yīng)用于辦公、娛樂(lè)、新聞等各類(lèi)場(chǎng)景中,每天為來(lái)自全球的過(guò)億用戶(hù)提供優(yōu)質(zhì)的翻譯體驗(yàn)。
火山翻譯團(tuán)隊(duì)擁有百余項(xiàng)技術(shù)發(fā)明專(zhuān)利,在人工智能頂級(jí)國(guó)際學(xué)術(shù)會(huì)議已發(fā)表50余篇學(xué)術(shù)論文。其自研的高性能序列推理引擎LightSeq,推理速度業(yè)界領(lǐng)先,比原生系統(tǒng)提高10倍,翻譯速度可達(dá)20,000詞/秒。
在近期剛結(jié)束的機(jī)器學(xué)習(xí)頂級(jí)賽事——2020國(guó)際機(jī)器翻譯大賽(WMT2020)中,經(jīng)過(guò)全球語(yǔ)言專(zhuān)家充分評(píng)估,火山翻譯在「中文-英語(yǔ)」語(yǔ)向翻譯項(xiàng)目上力壓群雄,以顯著優(yōu)勢(shì)獲得世界冠軍。
在人工智能領(lǐng)域,“如何讓AI更好地賦能行業(yè)”一直是個(gè)值得探索的方向。火山翻譯的火山同傳在這個(gè)方向上對(duì)外邁出了堅(jiān)實(shí)的一步,將機(jī)器同傳的高效快捷和人工翻譯的精準(zhǔn)進(jìn)行結(jié)合。此次村上隆跨國(guó)直播中,火山同傳就為觀眾提供了“影院級(jí)字幕”的直播體驗(yàn),實(shí)現(xiàn)“1+1>2”的效果。
李磊表示:“火山翻譯將致力于打造前沿研究、產(chǎn)品研發(fā)和用戶(hù)反饋的閉環(huán),在迭代中快速進(jìn)步。希望火山翻譯能幫助更多用戶(hù)進(jìn)行國(guó)際跨語(yǔ)言交流,為行業(yè)乃至整個(gè)社會(huì)發(fā)展貢獻(xiàn)一份力量。”