國際人工智能聯(lián)合會理事會主席、香港科技大學(xué)計(jì)算機(jī)科學(xué)及工程學(xué)系主任楊強(qiáng)教授
以下為演講實(shí)錄:
剛才我們聽到了幾位從不同方面給我們解讀了人工智能、金融、數(shù)大局方面的前景。今天,我的主題是從另外一個(gè)方面來看這個(gè)問題。
首先我是一個(gè)做學(xué)術(shù)的,同時(shí)我對商業(yè)也有著濃厚的興趣,所以我想探討一下從學(xué)術(shù)的角度來看商業(yè)的問題,我們會得到哪些新的發(fā)現(xiàn)。
首先來看一下ALPHAGO的成功,首先ALPHAGO能夠引起很大的振動(dòng),我們從中能學(xué)到什么,對我們的商業(yè)方向有哪些指導(dǎo)呢?
首先我們看一下AlphaGo本身是幾個(gè)算法的結(jié)合,深度學(xué)習(xí),還有一個(gè)算法叫做強(qiáng)化學(xué)習(xí),就是中間這個(gè)圖所表達(dá)的,算法和環(huán)境有一個(gè)有機(jī)的連接,那么環(huán)境不斷給算法提供反饋,深度學(xué)習(xí)就像右邊這個(gè)圖所表達(dá)的,它既能告訴你你當(dāng)前的狀態(tài),又能為你未來的行為提供一個(gè)指導(dǎo)。
這樣一個(gè)算法是不是可以應(yīng)用在我們實(shí)際當(dāng)中去呢?我們看一下,從當(dāng)中我們可以獲得不同的解讀,這個(gè)是我的一個(gè)想法。
首先,是這個(gè)閉環(huán)的路徑要短。商業(yè)路徑也好、算法路徑也好,它的中間最好不要有過多的環(huán)節(jié),比方說從用戶到得到反饋,到反饋到AI的算法得到補(bǔ)充,最后再返回到應(yīng)用,這個(gè)閉環(huán)要足夠短。
第二,這個(gè)反饋一定要足夠高頻、高通量的反饋,不斷得到反饋,系統(tǒng)得到刺激,這樣它的智能才能夠成長。
第三個(gè),也是大家過去比較忽略的,它的反饋效果一定要起到一個(gè)復(fù)合的作用,我們在經(jīng)濟(jì)上經(jīng)常講復(fù)合收益,在人工智能上的成功這一點(diǎn)也是非常重要的,像這個(gè)圖所表達(dá)的,也就是說這一輪的反饋對系統(tǒng)的增益要持續(xù)進(jìn)行,就會有一個(gè)指數(shù)型的收益上升。
我們再看看周邊實(shí)際遇到的問題,是不是有很多類似的場景滿足這樣的需求呢。我們回顧一下人工智能的里程碑。
九七年,我們有深藍(lán)。然后一一年的時(shí)候我們有IBM watson,最近我們又有了AlphaGo,無人車,包括最近有了德州撲克,這些都是我們引以為豪的人工智能。
在這些里程碑的成功背后是不是路徑閉環(huán)足夠短,反饋?zhàn)銐蝾l繁。另外,復(fù)合作用是非常明顯,系統(tǒng)在不斷改進(jìn)自己,智能在提升。
再看一下周邊的工作,所以我就有一個(gè)想法。人工智能在現(xiàn)階段的應(yīng)用并不是在所有領(lǐng)域都會取得成功,我們一定要非常仔細(xì)挑選在哪些領(lǐng)域人工智能比較容易得到成功,在哪些領(lǐng)域還要等一等。
所以,下面就要來看一下技術(shù)和商業(yè)這兩方面到底哪些是我們現(xiàn)在可以得到效益的風(fēng)口。
首先來看一下技術(shù)風(fēng)口。人類的知識獲得70%以上都是通過視覺的,也一點(diǎn)都不奇怪,深度學(xué)習(xí)的發(fā)展肯定對人工智能的應(yīng)用、對人工智能的技術(shù)一定是持續(xù)發(fā)展的。比方左邊列的這些技術(shù)方向,包括用更好的深度學(xué)習(xí)、可解釋的深度學(xué)習(xí),包括理解物體之間的關(guān)系,包括通過一個(gè)視頻可以理解里面的一些人類能理解的摘要,把它給取出來,為人類和計(jì)算機(jī)的模型進(jìn)行溝通。
自然語言緊隨其后,包括文本的閱讀、理解、產(chǎn)生、問答、分析等等,現(xiàn)在深度學(xué)習(xí)都帶來了非常大的提高。但是,這個(gè)提高還是要隨著算法的提升有待更加地提高,在使用當(dāng)中能夠產(chǎn)生更大的效益。
另外一個(gè),智能推薦。在電商、在往上購物等等都有這個(gè)推薦。但是推薦的一個(gè)重大的問題就是我們很容易陷入一個(gè)所謂的深坑,就是在機(jī)器學(xué)習(xí)技術(shù)上所說的過擬合。當(dāng)我們點(diǎn)擊了一個(gè)在手機(jī)上的新聞,我們會得到好多這樣的新聞,系統(tǒng)不會顧及到我們對其他的興趣。
怎么樣解決這些問題呢?這個(gè)就是技術(shù)上的革新所期待的,我們在這方面也在不斷做新的研究。
還有一個(gè)就是我個(gè)人的研究,遷移學(xué)習(xí)。比方說人類很自然就會使用遷移學(xué)習(xí),我們在一個(gè)領(lǐng)域很專業(yè),怎么把這個(gè)知識遷移到另外一個(gè)領(lǐng)域,能不能讓計(jì)算機(jī)也有這個(gè)能力。有很多的專家認(rèn)為這就是人工智能機(jī)器學(xué)習(xí)下一個(gè)的熱點(diǎn)。
遷移學(xué)習(xí)也會帶來很多技術(shù)革新。比方,我們可以在一些小數(shù)據(jù)上面應(yīng)用大數(shù)據(jù)得到的結(jié)果,在一個(gè)領(lǐng)域得到一個(gè)非常好的模型,可以把它遷移到周邊一些小數(shù)據(jù)的模型,這個(gè)也是人類學(xué)習(xí)的一個(gè)有效的模式。
另外一個(gè),遷移學(xué)習(xí)可以使得模型的可靠性得到加強(qiáng),一個(gè)模型產(chǎn)生了,我們可以讓它在不同的場合都適用,這個(gè)模型就更加可靠。
再有,越來越多的個(gè)性化的需求,在場景當(dāng)中經(jīng)常聽到這樣的名詞,千人千面,這樣一個(gè)場景可以用遷移學(xué)習(xí)實(shí)現(xiàn)。比如右邊這個(gè)圖表現(xiàn),如果在云端得到一個(gè)通用的模型,可以把它適配到各個(gè)終端,使它在不同的終端就有不同模型的體現(xiàn),這樣就實(shí)現(xiàn)一個(gè)個(gè)性化。
它帶來的另外一個(gè)好處就是遷移學(xué)習(xí)可以解決隱私問題,每一個(gè)終端用戶都不必把他的個(gè)性化的數(shù)據(jù)上傳到云端,就可以得到它的結(jié)果。
所以,我們很期待這樣一個(gè)技術(shù)的革新。
這里是遷移學(xué)習(xí)的一個(gè)實(shí)例,右邊這個(gè)圖表示遷移學(xué)習(xí)不一定是一步到位,從一個(gè)模型遷移到一個(gè)場景,我們可以通過一系列的場景把一個(gè)模型遷移到不同的更廣泛的范圍,比方說一個(gè)手段就是中間這個(gè)圖所示的用深度學(xué)習(xí)來做遷移學(xué)習(xí),這也是我最近一個(gè)研究方向。
最右邊這個(gè)圖就表現(xiàn)了一個(gè)實(shí)際的應(yīng)用。最近斯坦福大學(xué)和聯(lián)合國共同做了一個(gè)應(yīng)用,利用衛(wèi)星圖片分析非洲大陸不同地區(qū)的貧困程度。利用這種所謂傳遞式的遷移學(xué)習(xí),就大量節(jié)省了人力。過去是要派一些觀察員到本地去做各種積累、各種調(diào)查,現(xiàn)在不用了,現(xiàn)在就用衛(wèi)星圖片把白天和晚上的地球圖象加以比對,最后訓(xùn)練出一個(gè)模型,大大節(jié)省了人力。
這里我們看到這些技術(shù)可能的革新,這些技術(shù)革新和商業(yè)應(yīng)用方向有哪些是最契合的。這里我要特別提金融方向。我們之前提過,一個(gè)是閉環(huán)的路徑要短,一個(gè)是溝通要高頻,最后要有復(fù)合效應(yīng)產(chǎn)生,很快讓模型能夠變得壯大。那么金融就是這樣一個(gè)領(lǐng)域。
我不用多說大家也明白,在金融里面有各種各樣的場景,比方和用戶溝通的場景,金融的安全、活體識別、識別用戶本人,用人臉識別、用聲音識別、用行為識別。在后端,可以對用戶整個(gè)風(fēng)險(xiǎn)進(jìn)行分析,是不是應(yīng)該借貸。做一筆投資,在這筆投資之前要進(jìn)行風(fēng)險(xiǎn)分析,現(xiàn)在基于大數(shù)據(jù)和人工智能可以自動(dòng)產(chǎn)生這樣的分析,像個(gè)人和企業(yè)的征信。
另外運(yùn)營方面、投顧方面,我們都可以借助于人工智能大量加強(qiáng)提高效益。經(jīng)濟(jì)本身就是一個(gè)提高效益的不斷的過程。現(xiàn)在人工智能又為經(jīng)濟(jì)效益的提升提供了一個(gè)強(qiáng)大的動(dòng)力。
比方剛剛講的風(fēng)險(xiǎn)管理這里面又分監(jiān)控、識別、評估和干預(yù),每一個(gè)方面都可以有大量的人工智能的參與。
這里一個(gè)很有趣的例子是從京東金融本身的實(shí)踐得來的,就是人工智能可以幫助養(yǎng)雞,是一個(gè)非常有趣的應(yīng)用。比如過去一個(gè)養(yǎng)殖戶用12塊錢養(yǎng)一只雞,需要提前貸款,貸一筆很大的款放在那兒,這個(gè)時(shí)候就產(chǎn)生了很大利息支出,這個(gè)對養(yǎng)雞戶是一筆很大的費(fèi)用。但是雞的成長,小雞的時(shí)候不需要吃那么多的飼料,只有長大的時(shí)候才吃。不同的雞對不同飼料的需求也不一樣。當(dāng)我們能夠掌握這個(gè)過程的時(shí)候,我們就可以把把放貸變得因地制宜,在一開始養(yǎng)雞戶不需要借這么多錢,過去逐次增加。所以如果我們能夠做到按日計(jì)息就可以做到這一點(diǎn),就能夠大大提升效率。
到現(xiàn)在京東金融可以做到6分錢就養(yǎng)一只雞,用人工智能的算法來做分析。
同時(shí)我剛剛提到推薦系統(tǒng),大規(guī)模的機(jī)器學(xué)習(xí)系統(tǒng),當(dāng)前共有的一個(gè)問題是過擬合。就像剛才說的,在手機(jī)的一些新聞的APP上,當(dāng)我們點(diǎn)了一類的新聞以后,后面20個(gè)都是那一類的新聞,這是為什么呢?這是因?yàn)樵诩夹g(shù)上,它沒有照顧到兩個(gè)需求,一個(gè)是準(zhǔn)確性的需求,一個(gè)是多樣性的需求。
現(xiàn)在我們在研究上,我們在研究一個(gè)強(qiáng)化學(xué)習(xí)的模型,能夠把兩個(gè)需求全部照顧到,就是右邊這個(gè)名詞叫遷移的匪徒模型。用這個(gè)模型既照顧到準(zhǔn)確率,又召開到多樣性,就把過擬合的問題徹底解決。
最后,我要說一下JDD背后是一個(gè)大賽,同時(shí)在中美兩邊進(jìn)行。說起JDD,我要特別提KDD,即數(shù)據(jù)挖掘和知識發(fā)現(xiàn),在學(xué)術(shù)界大家都聽說過KDD,這樣的大會已經(jīng)有過20年的歷史,而且每一年都有一個(gè)大賽,就是由工業(yè)出題,也變成了我們發(fā)現(xiàn)一些優(yōu)秀團(tuán)隊(duì)的一個(gè)方式。
今年的JDD也是采用了這樣一個(gè)在金融方面的非常大的機(jī)會,今年的機(jī)會來自四個(gè)方面,都是緊貼著金融應(yīng)用的。一個(gè)是登陸的行為識別,要發(fā)現(xiàn)有沒有可能是欺詐的行為,這里面需要深度學(xué)習(xí),需要了解一些金融的知識,所以需要兩方面的知識,這也是JDD大賽的一個(gè)特點(diǎn),我們不僅要技術(shù)上的革新,同時(shí)也需要這些參賽隊(duì)伍能夠?qū)懗鲆粋€(gè)商業(yè)計(jì)劃,能夠把商業(yè)場景想清楚。
第二,金融界非常關(guān)鍵的一個(gè)需求,就是信貸需求的預(yù)測,還有店鋪銷量的預(yù)測。
最后一個(gè)非常有趣的識別叫做豬臉識別,而不是人臉識別。豬臉識別是需要做什么呢?首先我們可以獲取到大量數(shù)據(jù),而不用擔(dān)心隱私問題,我們想豬可能不太關(guān)心隱私。同時(shí)又是一個(gè)活體識別的問題。同時(shí)確確實(shí)實(shí)背后有一個(gè)商業(yè)場景的問題,我們可以設(shè)想一下,假如有學(xué)生參加這個(gè)比賽,一個(gè)場景就是它可以幫助養(yǎng)豬戶鑒別不同的豬只在養(yǎng)殖過程中的各種活動(dòng),這個(gè)豬是不是活躍,它是不是散養(yǎng)的,它還是一只非常不愛動(dòng)的豬,對健康就可以作決策,對保險(xiǎn)就可以作預(yù)測。另外消費(fèi)者可能也會有挑選,有人可能喜歡不同的豬肉,可能對整個(gè)的歷史還有豬的鑒別就有個(gè)別個(gè)性化的需求。所以既有深度學(xué)習(xí)的應(yīng)用,又有商業(yè)的應(yīng)用,所以這是非常有趣的一個(gè)題目。
我們就很期待這樣一個(gè)學(xué)術(shù)界和金融界的結(jié)合,就是從JDD大賽開始。
謝謝大家!