據筆者了解,科大訊飛很早之前就已經將噪音抗變換性工作做到了A,I.語音引擎之內。具體來說,在進行語音識別時,訊飛輸入法會將待識別的語音處理成與模型訓練時相一致的語音特征:實時語音錄音先通過環(huán)境嗅探區(qū)分出噪音環(huán)境的分類(車內外噪音、會場音響噪音、地鐵噪音等等)。

云圖片

具體來說,分領域噪音補償可基于環(huán)境嗅探的知識分辨出各種不同領域,自動采用不同的算法去除帶噪語音中的噪音,從而達到提高信噪比的效果;而混合訓練技術則可以彌補去噪后語音所產生的同真實安靜語音的語譜差異。以此實現噪音環(huán)境的識別性能大幅提升,綜合形成抗噪解決方案。

云圖片

筆者測試,在默認中文“普通話(隨心說)”識別模式下,訊飛輸入法能夠在噪聲環(huán)境保持高精準的識別效果。

可是話說回來,生活中總有一些地方比如安靜的辦公場所,會議室或人多的地鐵、電影院等公共場合,這時候大聲說話來語音輸入會顯得十分尷尬,那么有沒有化解之法?

新版本的訊飛語音輸入法(Android和iOS)提升耳語輸入的識別效果。顧名思義,耳語輸入就是像用“耳語”般使用低分貝音量進行語音輸入,即便聲音很小也不會影響手機的識別準確率。有了這項功能,就能能決用戶在很多場合下使用語音輸入不便的痛點,無論安靜的辦公場所、會議室還是人多的地鐵、電影院等公共場合都能繼續(xù)語音輸入。

云圖片

特別值得一提的是,訊飛輸入法的語音輸入已經自適應大聲和耳語。在默認中文“普通話(隨心說)”識別模式下,點擊麥克風對著手機耳語說話,文字立即呈現在屏幕上,如此也不會打擾到周圍人,還能繼續(xù)暢快地使用語音輸入。如果你常常因大聲說話而尷尬,不妨來試一試訊飛輸入法的耳語輸入。

作為一家技術驅動型的企業(yè),近十年訊飛輸入法一直致力于語言和語音的研究,目前在語音識別、語義理解、機器翻譯等方面均取得了行業(yè)領先的成果并實現產品落地,此次升級A.I.語音輸入引擎,不僅會推動整個行業(yè)的技術革新,也意味著科大訊飛在A.I.應用領域的實力達到更高的發(fā)展水平。

分享到

songjy

相關推薦