“深度合成”技術(shù)日趨成熟,在多個(gè)領(lǐng)域?qū)崿F(xiàn)落地應(yīng)用

人臉合成、語(yǔ)音合成、視頻生成和數(shù)字虛擬人等概念近兩年非常火爆,而這背后依靠的便是 “深度合成”技術(shù)?!吧疃群铣墒且环NAI合成內(nèi)容的技術(shù),依賴于人工智能技術(shù),是人工智能發(fā)展到一定階段的產(chǎn)物。我們認(rèn)為深度合成類(lèi)的AI技術(shù)應(yīng)用之所以能夠近兩年興起,很大程度上得益于生成對(duì)抗網(wǎng)絡(luò)算法的出現(xiàn),這種算法可以用于生產(chǎn)高度逼真的合成的數(shù)據(jù)?!痹谘杏憰?huì)上,張欽坤對(duì)該技術(shù)的發(fā)展進(jìn)行了闡述。

在李季檁看來(lái),目前“深度合成”已經(jīng)具備了以下幾個(gè)優(yōu)勢(shì):第一,合成工具的進(jìn)化,以往需要大量高級(jí)工具的復(fù)雜操作,現(xiàn)在只需一鍵式的端到端合成即可。第二,合成的效果越來(lái)越難分辨真假。第三,可實(shí)現(xiàn)此前無(wú)法做到的合成,比如將頭腦中的想象落實(shí)到實(shí)際操作上,將真實(shí)人物與游戲角色等虛擬人物相結(jié)合等。

在行業(yè)應(yīng)用方面,郭成杰認(rèn)為,目前深度合成重點(diǎn)還是在臉部,未來(lái)可能會(huì)從單純的臉部發(fā)展到全身、動(dòng)作深度的合成。此外,視覺(jué)、語(yǔ)音的深度合成,與語(yǔ)音的交互技術(shù)未來(lái)也會(huì)有比較深度的結(jié)合。

“深度合成已經(jīng)從傳統(tǒng)的Deepfake發(fā)展到了更多元化的應(yīng)用,無(wú)論是社交、藝術(shù)、醫(yī)療、科研等都會(huì)有深度合成技術(shù)的應(yīng)用場(chǎng)景?!睆垰J坤稱。

深度合成目前主要有三大應(yīng)用領(lǐng)域:第一,娛樂(lè)和數(shù)字內(nèi)容。比如游戲體驗(yàn)方面,騰訊旗下網(wǎng)絡(luò)游戲“和平精英”,就引入了深度合成應(yīng)用,玩家可化身游戲中的“和平精英”與火箭少女101同框合影,背后所依托的正是騰訊優(yōu)圖實(shí)驗(yàn)室的人像融合技術(shù)。這一技術(shù)還能用于H5等活動(dòng)營(yíng)銷(xiāo)傳播、游戲影視制作、以及各類(lèi)相機(jī)App等。第二,數(shù)字人領(lǐng)域,比如虛擬主播、虛擬歌手、虛擬助手等。第三,對(duì)于教育、醫(yī)療健康等社會(huì)性問(wèn)題,“深度合成”技術(shù)可以發(fā)揮出“科技向善”的力量。

“深度合成”迎商業(yè)化應(yīng)用元年,法律監(jiān)管問(wèn)題不容小覷

隨著社會(huì)對(duì)深度合成技術(shù)及相關(guān)應(yīng)用的認(rèn)識(shí)逐漸趨于理性,騰訊研究院和騰訊優(yōu)圖實(shí)驗(yàn)室此前發(fā)布的報(bào)告《AI生成內(nèi)容發(fā)展報(bào)告2020——“深度合成”商業(yè)化元年》提出,2020年有望成為深度合成技術(shù)走向大規(guī)模商業(yè)化應(yīng)用的元年。

目前,大眾對(duì)深度合成應(yīng)用接觸更多的是換臉App?!拔磥?lái)對(duì)于換臉App,我們也期待它跟更多的落地化的商業(yè)應(yīng)用做一些結(jié)合,能夠去產(chǎn)生一些更有持續(xù)性的發(fā)展?!惫山芊Q,虛擬人在商業(yè)化方面也有非常大的延展性,未來(lái)在教育、旅游,包括公共場(chǎng)所的咨詢,我們需要一些比較多的重復(fù)性的人力接待、播報(bào)或者講解的地方,都可以用虛擬人做一些應(yīng)用?!拔磥?lái)隨著深度合成技術(shù)的進(jìn)一步發(fā)展,我們?cè)谡麄€(gè)行業(yè)里面去結(jié)合現(xiàn)有的商業(yè)模式和服務(wù)模式,尤其像服務(wù)體驗(yàn)這方面可能都會(huì)幫助大家有所提升?!?/p>

新技術(shù)帶來(lái)變革的同時(shí)也會(huì)帶來(lái)一定的風(fēng)險(xiǎn)和挑戰(zhàn),Deepfake這個(gè)概念之所以剛開(kāi)始名噪一時(shí),也是因?yàn)楹芏嗳送ㄟ^(guò)深度合成的技術(shù)偽造了很多虛假的、真假難辯的圖片、音視頻等來(lái)進(jìn)行一些非法活動(dòng)。因此,深度合成技術(shù)的治理問(wèn)題也成為業(yè)界關(guān)注的焦點(diǎn)。

從技術(shù)方面,張欽坤分享了國(guó)外對(duì)“深度合成”技術(shù)進(jìn)行包容審慎監(jiān)管的五點(diǎn)措施:一是不得誤導(dǎo)公眾,需要披露人工智能的身份;二是劃定紅線,某些領(lǐng)域是深度合成技術(shù)不能應(yīng)用的;三是內(nèi)容制作者要承擔(dān)披露的義務(wù);四是呼吁技術(shù)公司能夠研發(fā)檢測(cè)識(shí)別深度合成內(nèi)容的反制技術(shù);五是要求深度合成的開(kāi)發(fā)者必須要遵守隱私和個(gè)人信息保護(hù)的相關(guān)要求。他同時(shí)指出,需要依靠法律、技術(shù)、行業(yè)自律、公眾教育等多層次治理體系,來(lái)促進(jìn)技術(shù)的妥善應(yīng)用和良性發(fā)展。

據(jù)悉,騰訊優(yōu)圖實(shí)驗(yàn)室自2013年做刷臉技術(shù)研發(fā)起,便開(kāi)始通過(guò)活體檢測(cè)技術(shù)以保證人臉安全。經(jīng)過(guò)多年的努力,騰訊優(yōu)圖實(shí)驗(yàn)室在人臉安全領(lǐng)域已完成三方面布局:一是對(duì)真人和特定介質(zhì)載體展現(xiàn)出來(lái)的人臉進(jìn)行區(qū)分;二是既做內(nèi)容的生成也做內(nèi)容的防御;三是對(duì)于新出現(xiàn)的對(duì)抗噪音問(wèn)題,比如臉上戴了一個(gè)特定的眼鏡片就將某人識(shí)別成其他人,騰訊優(yōu)圖已經(jīng)在深度模型底層的機(jī)制上去研究對(duì)抗的方法,防止一些安全風(fēng)險(xiǎn)的出現(xiàn)。

目前,在內(nèi)部的一些評(píng)測(cè)中,如果已知是哪種深度合成的方法,優(yōu)圖檢測(cè)模型的檢測(cè)率已經(jīng)可以達(dá)到99%。同時(shí),在Facebook舉辦的Deepfake Detection Challenge (DFDC)比賽當(dāng)中,騰訊優(yōu)圖在2000多支隊(duì)伍中進(jìn)入前十,并拿到金牌。

在法律方面,張吉豫認(rèn)為深度合成作為一種新的技術(shù)、新的應(yīng)用、新的業(yè)態(tài),對(duì)于它的監(jiān)管,整體需要遵循包容審慎監(jiān)管的原則?!皩徤饔袃煞矫娴暮x:第一,技術(shù)剛出來(lái)的時(shí)候,需要給一個(gè)觀察期;第二,要嚴(yán)守安全底線,對(duì)一些謀財(cái)害命、侵權(quán)行為不管是傳統(tǒng)業(yè)態(tài)還是新業(yè)態(tài)都要采取嚴(yán)厲的措施予以打擊?!?/p>

從社會(huì)治理角度,陳昌鳳認(rèn)為可以通過(guò)網(wǎng)絡(luò)治理,所謂多利益相關(guān)方聯(lián)合治理的這個(gè)模式來(lái)入手,多利益相關(guān)方的治理一定是包括平臺(tái)的治理,平臺(tái)要用技術(shù)來(lái)治理,所以平臺(tái)的技術(shù)治理也是一個(gè)重要的方面。

面對(duì)新技術(shù)的挑戰(zhàn),政府和監(jiān)管者應(yīng)當(dāng)包容審慎,避免阻礙深度合成技術(shù)的有益的、創(chuàng)新性的應(yīng)用,通過(guò)法律、技術(shù)、行業(yè)、用戶的多重治理將其納入可控的發(fā)展軌道。

正如徐峰所言,對(duì)于人工智能的治理,首先要在尊重和更好認(rèn)識(shí)人工智能自身發(fā)展規(guī)律基礎(chǔ)上有一個(gè)系統(tǒng)的考慮,既需要像新一代人工智能治理原則這樣的框架性和理念性的指南,也需要針對(duì)具體技術(shù)、具體應(yīng)用、具體領(lǐng)域針對(duì)性的治理措施。在發(fā)展技術(shù)的同時(shí),也要加強(qiáng)相關(guān)潛在風(fēng)險(xiǎn)的研判,做好政策儲(chǔ)備和應(yīng)對(duì)策略,防患于未然。

分享到

songjy

相關(guān)推薦