快商通首席科學(xué)家李海洲教授
為什么聲紋技術(shù)可以進(jìn)行有效安全防范?
李海洲教授向記者介紹道:“聲紋識別技術(shù),是用說話人的聲音,以逆向工程(reverse engineering)來描述說話人的聲道、口腔、口腔容量、聲道長度、鼻腔等相關(guān)器官的結(jié)構(gòu)和狀態(tài)。聲紋識別具有唯一性、穩(wěn)定性等特征?!?隨著聲紋識別率的提高,聲紋技術(shù)已經(jīng)在安全,金融,社交,通信平臺上進(jìn)入廣泛的商業(yè)應(yīng)用。因此,它的安全性也得到廣泛的關(guān)注。目前全球?qū)τ诼暭y技術(shù)的安全性研究主要集中在“聲紋技術(shù)的反欺詐”。
對于聲紋反欺詐的安全防范方式,李海洲教授認(rèn)為可以概括為以下幾種:
首先是數(shù)據(jù)學(xué)習(xí)方法(Adversary training),即通過離異數(shù)據(jù)訓(xùn)練,使機(jī)器學(xué)習(xí)到真實(shí)的說話人數(shù)據(jù)與虛假/其他說話人數(shù)據(jù)之間的邊界,以數(shù)據(jù)分布式學(xué)習(xí)的方式實(shí)現(xiàn)反欺詐。
第二是輸入確認(rèn):聲紋先進(jìn)入非自然語音檢測的輸入確認(rèn)模塊,排除干擾,保護(hù)說話人識別模塊。這也是當(dāng)下較主流的做法。
輸入確認(rèn)
第三是拒接絕對拷貝(錄音回放):每一次聲紋輸入,都將其絕對拷貝下來。在進(jìn)行聲紋驗(yàn)證時,若對比判斷為一致,則該聲紋為錄音。
第四是檢測電磁場干擾:錄音回放時會,手機(jī)內(nèi)置揚(yáng)聲器周圍的電磁場會受到擾動,指南針隨之?dāng)[動,據(jù)此可判斷該聲音為回放。
第五是檢測物理聲波:即通過改變硬件設(shè)計達(dá)到反欺詐效果。
簡單來說,聲紋識別技術(shù)目前已經(jīng)能夠有效地進(jìn)行風(fēng)險防范。李海洲教授已帶領(lǐng)快商通團(tuán)隊研究出1:N場景下的身份識別應(yīng)用。與傳統(tǒng)驗(yàn)證方式相比,1:N的識別能在電話端實(shí)現(xiàn)遠(yuǎn)距離、高精度的身份認(rèn)證與身份反欺詐,只需要一通電話,幾秒鐘時間就能確定說話人的真實(shí)身份。
各領(lǐng)域用戶要如何應(yīng)用聲紋識別技術(shù)?
以聲紋反欺詐進(jìn)行風(fēng)險防范,這一方式已被越來越多的產(chǎn)業(yè)單位所接受,也逐漸得到各級監(jiān)管部門的認(rèn)可。然而,面對一系列諸如《關(guān)于加強(qiáng)II、III類銀行結(jié)算賬戶風(fēng)險防范有關(guān)事項(xiàng)》的建設(shè)要求,各領(lǐng)域用戶當(dāng)如何高效運(yùn)用聲紋技術(shù),使其發(fā)揮出反欺詐的最大效能?
這個問題,當(dāng)與欺詐方式結(jié)合思考。李教授表示,欺詐行為一般分為兩種:
其一是數(shù)據(jù)入侵,即黑客進(jìn)入數(shù)據(jù)庫,并將修改的聲紋放入系統(tǒng)中。目前數(shù)據(jù)入侵分為三種形式。黑盒子攻擊,以機(jī)器學(xué)習(xí)的方法來攻擊機(jī)器學(xué)習(xí),無窮盡地向系統(tǒng)輸入數(shù)據(jù),觀察其輸出結(jié)果,便可得知該系統(tǒng)的數(shù)據(jù)偏好。白盒子攻擊,則是針對已知市場上各系統(tǒng)算法的模型、機(jī)制,并倒推其弱點(diǎn)進(jìn)行攻擊?;液凶庸艚Y(jié)合了以上兩種方法,既有機(jī)器學(xué)習(xí)的工具,又了解系統(tǒng)的運(yùn)作結(jié)構(gòu)。
李教授認(rèn)為,防止數(shù)據(jù)入侵,需要技術(shù)廠商與企業(yè)用戶共同努力,主動、及時了解黑客的做法,有針對性地完善聲紋識別系統(tǒng)前端安全性。
另一種欺詐行為,則是公檢法、金融、社保等各個領(lǐng)域普遍關(guān)心的物理入侵。
以金融領(lǐng)域?yàn)槔蟛糠纸鹑跈C(jī)構(gòu)壞賬來源于黑中介主導(dǎo)的產(chǎn)業(yè)鏈?zhǔn)皆p騙。因此,在審查環(huán)節(jié)及時鑒別出黑中介,成為降低消費(fèi)金融公司壞賬率的關(guān)鍵因素。在傳統(tǒng)單一身份識別手段低效的情況下,如快商通“遠(yuǎn)程實(shí)時身份認(rèn)證與身份反欺詐平臺”的解決方案毫無疑問成為金融風(fēng)控的核心。
聲紋反欺詐應(yīng)用流程
在公共安全領(lǐng)域中,聲紋反欺詐也能對電信詐騙等問題提供有效的解決方案。針對犯罪分子錄音、回放等欺詐形式,可以參考快商通“聲紋鑒定工作站”、“聲紋偵查作戰(zhàn)平臺”等方案,有針對性的識破違法行為,進(jìn)而維護(hù)社會治安,保障國家人民財產(chǎn)安全。
聲紋技術(shù)應(yīng)用落地,用戶最關(guān)心什么?
“聲紋識別系統(tǒng)魯棒性和安全性之間的平衡和相關(guān)參數(shù)的調(diào)整,是各大用戶關(guān)注的重點(diǎn),同時也是全世界范圍內(nèi)聲紋相關(guān)廠商現(xiàn)階段面臨的主要難題。”李海洲教授如是說道。
在聲紋識別的過程中,傳感器和信道的不同、環(huán)境的變化以及周圍的噪音、說話人情緒、健康狀態(tài)的變化以及其年齡的增長、不同語言的使用等因素,都會影響聲紋識別的識別率,進(jìn)而降低用戶的使用體驗(yàn)與效率。
想要克服這些影響,便需要提升系統(tǒng)的魯棒性(robustness),也就是抗變換性,以保障聲紋系統(tǒng)在不同的條件下的識別率。但與此同時,還要關(guān)注系統(tǒng)魯棒性和安全性之間的平衡問題。
針對聲紋安全系統(tǒng),目前各技術(shù)廠家主流的做法是在聲紋識別模塊前建立非自然語音檢測模塊,但這顯然犧牲了一定的魯棒性。而聲紋系統(tǒng)的使用者,更希望得到的數(shù)據(jù)是檢測系統(tǒng)的拒絕數(shù)量以及正確認(rèn)證數(shù)量,這正是大部分聲紋技術(shù)廠商現(xiàn)階段需要突破的問題。
對于這一點(diǎn),李海洲教授認(rèn)為,聲紋企業(yè)當(dāng)如快商通一般,既研究安全性的提升,也兼做魯棒性,把自然語音判斷和聲紋系統(tǒng)相結(jié)合,進(jìn)而得到最優(yōu)答案,提供完整的系統(tǒng)性結(jié)論。
推動聲紋反欺詐發(fā)展,科技惠民,賦能百業(yè)
作為在人工智能領(lǐng)域從事科研工作三十余年的權(quán)威專家,李海洲教授曾任亞太信號與信息處理協(xié)會 (APSIPA)主席及國際語音通信協(xié)會(ISCA)主席,并先后在第四屆亞太信號與信息處理協(xié)會年度會議 (APSIPA Annual Conference and Summit 2013) 和第十九屆國際語音通信年會 (INTERSPEECH 2018)上 做了專題報告。李海洲教授對聲紋反欺詐的理解和技術(shù)積累,在一定程度上推動了聲紋反欺詐的國際科技合作和系統(tǒng)評測標(biāo)準(zhǔn)化。
李教授表示,隨著聲紋識別技術(shù)的逐漸成熟以及聲紋反欺詐的不斷落地,未來會涌現(xiàn)出更多的聲紋識別應(yīng)用場景。如何引導(dǎo)聲紋識別技術(shù)向著更加產(chǎn)業(yè)化、規(guī)范化的方向發(fā)展,如何合理挖掘應(yīng)用場景并進(jìn)行針對性開發(fā),這是快商通作為業(yè)內(nèi)先進(jìn)企業(yè)的責(zé)任,同時也是產(chǎn)學(xué)研各界未來必須要關(guān)注的問題。
“2018年是聲紋技術(shù)發(fā)展的元年,而今年,圍繞聲紋技術(shù)展開的科學(xué)研究和落地項(xiàng)目都將會有井噴式的爆發(fā)”李海洲教授講道,金融、公檢法等各個應(yīng)用領(lǐng)域的用戶,都要抓住技術(shù)賦能產(chǎn)業(yè)的重大機(jī)遇,改善產(chǎn)業(yè)結(jié)構(gòu),實(shí)現(xiàn)智能化發(fā)展。