ICASSP是國(guó)際聲學(xué)語(yǔ)言和信號(hào)處理的旗艦會(huì)議,和InterSpeech會(huì)議并稱(chēng)語(yǔ)音信號(hào)處理領(lǐng)域的雙雄,每年都會(huì)吸引數(shù)千名全球各地的語(yǔ)音信號(hào)領(lǐng)域和人工智能領(lǐng)域知名專(zhuān)家、學(xué)者、企業(yè)和開(kāi)發(fā)人員參加。

由于ICASSP是2018年語(yǔ)音領(lǐng)域的首場(chǎng)旗艦級(jí)會(huì)議(InterSpeech將于9月召開(kāi)),所以其學(xué)術(shù)研究方向、科技成果轉(zhuǎn)化內(nèi)容和產(chǎn)業(yè)發(fā)展趨勢(shì)倍受關(guān)注,甚至?xí)h內(nèi)容被業(yè)界譽(yù)為“風(fēng)向標(biāo)”,會(huì)影響未來(lái)1~3年的技術(shù)走向。

三個(gè)場(chǎng)景展示阿里語(yǔ)音技術(shù)內(nèi)容

阿里巴巴在ICASSP會(huì)議上將通過(guò)三個(gè)場(chǎng)景展示語(yǔ)音技術(shù)內(nèi)容:一方面5位論文作者將在主會(huì)以O(shè)ral&Poster形式介紹阿里在語(yǔ)音信號(hào)處理技術(shù)上的最新技術(shù)研究?jī)?nèi)容;其次在會(huì)展核心區(qū)展示語(yǔ)音核心技術(shù)、語(yǔ)音主要產(chǎn)品、語(yǔ)音應(yīng)用場(chǎng)景和效果;最后的場(chǎng)景也是相對(duì)高規(guī)格和私密,通過(guò)“阿里之夜”WorkShop近距離系統(tǒng)化介紹語(yǔ)音技術(shù)和人工智能技術(shù)。

本屆ICASSP收錄的5篇論文全部出自機(jī)器智能實(shí)驗(yàn)室智能語(yǔ)音交互團(tuán)隊(duì),論文主題包括“語(yǔ)音合成的深度前饋序列記憶網(wǎng)絡(luò)”、“使用說(shuō)話(huà)人少量數(shù)據(jù)來(lái)合成語(yǔ)音的自適應(yīng)算法”、“針對(duì)影視作品的語(yǔ)音情感識(shí)別信息融合框架”、“高級(jí)長(zhǎng)短期記憶網(wǎng)絡(luò):關(guān)于更優(yōu)時(shí)間依賴(lài)性刻畫(huà)在情感識(shí)別方面的應(yīng)用”、“基于深層前饋序列記憶神經(jīng)網(wǎng)絡(luò)的大詞匯量連續(xù)語(yǔ)音識(shí)別”,涉及語(yǔ)音合成、語(yǔ)音識(shí)別、情感識(shí)別等聲學(xué)語(yǔ)言和信息處理方面的創(chuàng)新方法。

這些論文提到的創(chuàng)新方法相比傳統(tǒng)算法模型、網(wǎng)絡(luò)框架以及循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),在效率、性能方面有不同比例的提升。

ICASSP阿里巴巴展區(qū)

“阿里之夜”是阿里里巴巴在學(xué)術(shù)會(huì)議上舉辦的WorkShop品牌,目的是搭建全球?qū)W術(shù)合作橋梁,構(gòu)建全球產(chǎn)學(xué)研合作共同體?;顒?dòng)采取定向邀約制,參與人包括會(huì)議成員、合作機(jī)構(gòu)專(zhuān)家、論文作者等?!鞍⒗镏埂币殉蔀榘⒗锇桶蛥⒓訃?guó)際學(xué)術(shù)會(huì)議的品牌活動(dòng),在業(yè)內(nèi)具有廣泛影響力。

阿里巴巴資深技術(shù)專(zhuān)家田野在“阿里之夜”現(xiàn)場(chǎng)表示,阿里巴巴不僅注重基礎(chǔ)科學(xué)的研究,同樣重視技術(shù)與市場(chǎng)的融合。技術(shù)賦能用戶(hù)、賦能阿里的商業(yè)發(fā)展,釋放技術(shù)紅利價(jià)值,是阿里巴巴對(duì)技術(shù)與商業(yè)雙軌制發(fā)展的系統(tǒng)思考。

ICASSP阿里之夜WorkShop現(xiàn)場(chǎng)

阿里巴巴語(yǔ)音技術(shù)的標(biāo)志性應(yīng)用

2016年9月13日,浙江省高級(jí)人民法院開(kāi)庭現(xiàn)場(chǎng),用智能語(yǔ)音識(shí)別系統(tǒng)同步記錄了庭審中法官和訴訟參與人說(shuō)的每一句話(huà),在投射到LED屏幕時(shí)系統(tǒng)還不時(shí)自動(dòng)糾錯(cuò),整體識(shí)別準(zhǔn)確率達(dá)95%以上。這項(xiàng)語(yǔ)音技術(shù)由阿里巴巴提供,這也是語(yǔ)音技術(shù)首次走進(jìn)法院,承擔(dān)起“書(shū)記員”的角色。該應(yīng)用的落地,加快了中國(guó)法院將人工智能技術(shù)引入辦案系統(tǒng)的進(jìn)程。

2017年7月,阿里巴巴A.I. labs發(fā)布了首款智能音箱天貓精靈X1,雙11當(dāng)天售出了100萬(wàn)臺(tái),在2018年新品發(fā)布會(huì)上,阿里巴巴公布天貓精靈共售出200萬(wàn)臺(tái),直接讓200萬(wàn)個(gè)家庭體驗(yàn)到了人工智能與生活結(jié)合后的樂(lè)趣。

另一個(gè)標(biāo)志性事件是在去年11月,剛剛從烏鎮(zhèn)參加完世界互聯(lián)網(wǎng)大會(huì)的馬云,在上海的申通地鐵上用語(yǔ)音交互的方式購(gòu)買(mǎi)了一張地鐵票,阿里由此成為世界上首個(gè)掌握公共場(chǎng)所強(qiáng)噪音環(huán)境下實(shí)現(xiàn)語(yǔ)音交互技術(shù)的企業(yè)。通過(guò)語(yǔ)音實(shí)現(xiàn)購(gòu)票這一商業(yè)場(chǎng)景,主要得益于語(yǔ)音智能團(tuán)隊(duì)融合智能語(yǔ)音、計(jì)算機(jī)視覺(jué)等能力,并首次在公共場(chǎng)所嘈雜環(huán)境下,突破免喚醒主動(dòng)語(yǔ)音交互、強(qiáng)噪聲環(huán)境下高精度遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別等核心關(guān)鍵技術(shù)。

馬云<右二>在上海地鐵體驗(yàn)語(yǔ)音購(gòu)票

從賦能用戶(hù)角度看,阿里巴巴正通過(guò)云計(jì)算、AliGenie等開(kāi)放平臺(tái),向文娛、地產(chǎn)、酒店、旅游、法院、航空、制造、新聞等行業(yè)提供智能語(yǔ)音解決方案,加速人工智能技術(shù)賦能產(chǎn)業(yè)與商業(yè)發(fā)展。

無(wú)論是賦能用戶(hù),還是賦能阿里商業(yè)體系,都得益于阿里在技術(shù)上的突破,在今年全球首場(chǎng)人工智能會(huì)議AAAI上,阿里巴巴就有11篇論文入選。在2017年,阿里巴巴 不僅獲得ACM MM2020會(huì)議主辦權(quán),成為首個(gè)獲得主辦權(quán)的中國(guó)企業(yè),城市大腦成為首批入選國(guó)家新一代人工智能開(kāi)放創(chuàng)新平臺(tái)的人工智能技術(shù)服務(wù),而且在學(xué)術(shù)領(lǐng)域收貨頗多,在IJCAI會(huì)議上,阿里巴巴有11篇論文被收錄,CVPR會(huì)議收錄4篇、KDD會(huì)議收錄5篇,ACM MM會(huì)議收錄3篇。

近幾年,阿里巴巴一直在加大技術(shù)研究,以實(shí)現(xiàn)在基礎(chǔ)科學(xué)和顛覆性技術(shù)上取得進(jìn)展。為此,阿里巴巴成立全球性技術(shù)研究機(jī)構(gòu)“達(dá)摩院”,未來(lái)三年在技術(shù)上總投入將超過(guò)1000億人民幣,涵蓋機(jī)器智能、智聯(lián)網(wǎng)、金融科技等多個(gè)產(chǎn)業(yè)領(lǐng)域的技術(shù)研究?jī)?nèi)容。

分享到

songjy

相關(guān)推薦