遠(yuǎn)場多通道語音增強(qiáng)挑戰(zhàn)賽設(shè)置了兩個任務(wù)賽道,覆蓋單個麥克風(fēng)陣列的多通道語音增強(qiáng)任務(wù)和多個分布式麥克風(fēng)陣列的多通道語音增強(qiáng)任務(wù)。賽道一主要針對單個麥克風(fēng)陣列的多通道語音增強(qiáng)任務(wù),專注于現(xiàn)實視頻會議中算法實時處理的需求。賽道二針對多個分布式麥克風(fēng)陣列的多通道語音增強(qiáng)任務(wù),此挑戰(zhàn)任務(wù)專注于前沿算法研究,不設(shè)置任何算法限制。
目前,大賽報名通道已開啟,本次大賽的報名截至?xí)r間為3月7日,INTERSPEECH2021 Paper錄取結(jié)果通知將于6月2日公布,6月5日將公布大賽排名。在參賽規(guī)則方面,每個注冊成功的參賽團(tuán)隊可選任何一個任務(wù)參加,或同時注冊兩個任務(wù)。
此次比賽成績將通過騰訊在線多媒體主觀評估平臺,使用Absolute Category Ratings (ACR)來評估Mean Opinion Score (MOS)決定。獎金方面,每個任務(wù)排名為前兩名的隊伍將獲得由騰訊天籟實驗室提供的獎金,分別為1500 USD和800 USD。
值得一提的是,為了給參賽者提供真實視頻會議室的場景,遠(yuǎn)場多通道語音增強(qiáng)挑戰(zhàn)賽數(shù)據(jù)庫采集的數(shù)據(jù)大部分來自于真人實錄,會議中人數(shù)以及人與麥克風(fēng)陣列的距離都會隨著會議室的大小而變化,并且多個不同幾何拓?fù)浣Y(jié)構(gòu)的麥克風(fēng)陣列被分布于每個采集錄音的會議室中。
同時,為了使參賽者更關(guān)注于算法研究,大賽將提供訓(xùn)練數(shù)據(jù)的清單,只有清單中的數(shù)據(jù)可用于大賽兩個挑戰(zhàn)任務(wù)的模型訓(xùn)練。此外,大賽還將提供開發(fā)集,生成訓(xùn)練數(shù)據(jù)的代碼和多通道語音增強(qiáng)的基準(zhǔn)系統(tǒng)代碼,以便于參賽者開發(fā)多通道語音增強(qiáng)技術(shù)。
一直以來,為了解決實時音視頻應(yīng)用場景下的各種挑戰(zhàn),騰訊天籟實驗室圍繞著“聽得見,聽得清,聽得真”目標(biāo),對核心體驗技術(shù)和框架進(jìn)行了深入的探索,并于去年發(fā)布了“面向?qū)崟r音視頻應(yīng)用的新一代實時音頻技術(shù)品牌”騰訊天籟。該技術(shù)方案已在騰訊會議等產(chǎn)品中獲得了有效驗證,成為騰訊會議高速成長背后的技術(shù)密碼,助力騰訊會議上線兩個月內(nèi)日活躍用戶超過1000萬。未來,騰訊天籟實驗室將繼續(xù)鉆研音視技術(shù),滿足更多行業(yè)場景下的實時音視頻需求,推進(jìn)更多更豐富的場景落地而努力。
關(guān)注微信公眾號“騰訊天籟實驗室”報名參賽。