率先打造音視頻專屬語音識別模型,準確率提升10% 隨著互聯(lián)網(wǎng)直播浪潮的興起,如何利用智能語音技術快速識別用戶的音視頻內容、進行精準推薦和不健康內容過濾,已經成為各大直播和內容分享平臺在日益激烈的市場競爭中的核心競爭力。但由于音視頻背景環(huán)境復雜且屬于半遠場,需要有大量數(shù)據(jù)積累才能實現(xiàn)準確識別。 憑借自身在音視頻領域數(shù)據(jù)的大量積累,騰訊云在業(yè)界率先推出了音視頻領域專屬語音識別模型,目前已在多家音視頻領域直播平臺和電商直播平臺應用,經客戶實測,識別準確率提升近10%。
語種豐富度進一步提升,騰訊云語音識別加速落地 為滿足不同客戶群體需求,騰訊云語音識別今年在語種豐富度上持續(xù)發(fā)力,聯(lián)合微信智聆、騰訊國際業(yè)務語音技術實驗室、騰訊民漢翻譯等多個人工智能實驗室,在原有常見語種基礎上,開放了韓語、粵語的識別能力,后面會陸續(xù)開放對上海話等方言以及日語、泰語、印尼語等國外語言的語音識別能力。經過長期的打磨訓練和效果調優(yōu),目前騰訊云語音識別各語種已廣泛應用于會議記錄轉寫、視頻字幕、電話錄音質檢等業(yè)務場景。
實際上,騰訊云憑借多年在智能語音領域的耕耘,已經收獲眾多權威機構的認可。在Gartner今年首次正式發(fā)布的《Magic Quadrant for Cloud AI Developer Services》研究報告中,騰訊云成為中國唯一入選Gartner云AI開發(fā)者服務魔力象限的云廠商。 騰訊云AI語音產品負責人周超表示:“騰訊云AI語音團隊未來仍將繼續(xù)打磨技術,提供業(yè)界最具性價比的智能語音產品,推動智能語音在產業(yè)互聯(lián)網(wǎng)的廣泛落地。用更前沿的技術、更極致的產品體驗,幫助合作伙伴和客戶打造高效的專屬解決方案,助力各行各業(yè)的數(shù)字化和智能化轉型?!?nbsp;