創(chuàng)新工場創(chuàng)始人兼首席執(zhí)行官李開復(fù)。

以下文字根據(jù)李開復(fù)現(xiàn)場演講內(nèi)容整理(未經(jīng)本人審定)。

“大數(shù)據(jù)”這個詞熱了十年,“人工智能”這個詞熱了也超過了一年。

回顧近兩年的發(fā)展,我們會發(fā)現(xiàn)在很多領(lǐng)域機器其實都超過了人類。前一陣微軟發(fā)表了語音識別技術(shù),我們也投資了其他一些人臉識別技術(shù),這些技術(shù)早已經(jīng)超過了人類識別的能力,所以機器一次又一次地超過了人類。這代表什么樣的商機呢?是人類歷史以來最大的商機。

十年后,如果我們回顧人類的發(fā)展,會發(fā)現(xiàn)沒有任何市場比人工智能來得更大;移動互聯(lián)網(wǎng)已經(jīng)巨大,但它連人工智能的十分之一都沒有,這一點我可以確切地告訴大家。

我從30年前就開始探討索人工智能,但是沒有天時地利人和——機器不夠快,大數(shù)據(jù)中心不存在,數(shù)據(jù)不夠多,算法不夠先進……30年來,不斷有科學(xué)家發(fā)明新的技術(shù),從最近四五年開始,這項技術(shù)在很多獨特領(lǐng)域遠超人類。

雖然人工智能還有很多局限,如,沒有情感,一次只能涉足一個領(lǐng)域,不能跨領(lǐng)域思維,但是在狹窄領(lǐng)域里已經(jīng)遠遠超過了人類。

如何用一個更通俗的方法解釋什么是人工智能?想象一臺機器是剛出生的小寶寶,人類的小寶寶是用教育、用知識、用書本讓他們慢慢成長,但人工智能用什么來幫助他們成長呢?就是大數(shù)據(jù)。大量的大數(shù)據(jù)灌進去,他們成長就比人快。

但是機器一次只能專注在某一個領(lǐng)域,你要教它旅游、搜索、識別、聽語言、看文字、看人臉,在單一領(lǐng)域它可以做得非常好,但是跨領(lǐng)域做不到,所以人類還是有機會的。美國科學(xué)家發(fā)明的深度學(xué)習(xí)在中國已經(jīng)普遍開始使用,就是這個道理。

灌輸大量大數(shù)據(jù)可以幫助機器成長。姑且認(rèn)為人的大腦還是比機器優(yōu)秀,因為我們可以統(tǒng)籌各種知識和各種經(jīng)驗,但是機器有一個特別大的優(yōu)勢,即“過目不忘”,不僅可以儲存特別大量的數(shù)據(jù),而且能夠從數(shù)據(jù)中學(xué)會推理。如果它能夠看到的數(shù)據(jù)比我們多一千倍,哪怕我們比它聰明10倍,最后的結(jié)果是它還會比我們好100倍。

以無人駕駛為例,一個人,即便一天開100公里,一年365天地開,三五十年累積起來可能也就幾百萬公里的經(jīng)驗,但是算來,今天特斯拉已經(jīng)有20億公里數(shù)據(jù),比我們多了1000倍,而且算法還在不斷演進,它還在收集數(shù)據(jù),還沒有真實學(xué)會。即便我們現(xiàn)在比它聰明10倍,它也超過了人類。

人一輩子可能看幾十萬張臉,但記不住幾張。我們投資的一家做人臉識別的公司,訓(xùn)練的是50億張人臉,比我們多看了1000倍,我們要用一輩子時間,它可能是只用三天時間就記住了。所以現(xiàn)在保安這一類用人臉來做的工作根本比不上人工智能。

大數(shù)據(jù)的海量在各個狹窄的領(lǐng)域遠遠擊敗人類所能夠做的極限,因為我們沒有無限的時間,我們讀一本書的速度是很慢的,而IBM人工智能參加電視比賽的時候,一天就能夠把全部美國國會圖書館的所有藏書讀完。

大數(shù)據(jù)正在各個領(lǐng)域幫助人類創(chuàng)造價值。今天人們都在做大數(shù)據(jù)的人工智能,如百度的一條搜索,今日頭條的排序,淘寶推薦的每個產(chǎn)品,滴滴每次對接司機……背后都是人工智能;結(jié)合大數(shù)據(jù)的人工智能,可以廣泛應(yīng)用于傳統(tǒng)領(lǐng)域,比如銀行、保險、券商、機器人炒股。我個人的投資已經(jīng)兩年沒有給人,都是機器人幫我理財,但回報一定比人要好,這些領(lǐng)域人類根本不是對手。

在一個狹窄大數(shù)據(jù)領(lǐng)域,人類永遠不會有任何機會勝過機器。

在醫(yī)療、教育等其他傳統(tǒng)領(lǐng)域都有大量數(shù)據(jù),有超過人一生能看到的數(shù)據(jù),機器算法、人工智能可能幾天之后就能比人做得更好,產(chǎn)生的商業(yè)價值是不可想象的,絕對超過移動互聯(lián)網(wǎng),超過整個互聯(lián)網(wǎng),超過人類所有的歷史累積。

創(chuàng)新工場不只是在做預(yù)測。我們所管理的基金投資孵化的項目,超過一半是針對這個領(lǐng)域的,我們是真金白銀在賭即將來臨的人工智能時代。

這個時代即將來臨,我們能做什么事情呢?

首先是建立好一體化大數(shù)據(jù)中心。這個事情最重要。為什么呢?所有應(yīng)用需要的數(shù)據(jù)不是一個公司能夠收集的,是背后巨大的數(shù)據(jù)。這個數(shù)據(jù)中心必須一體化,因為除了應(yīng)用里面的數(shù)據(jù)之外,用戶填的數(shù)據(jù),外面還要抓取各種數(shù)據(jù)。

我們還希望收集在一體化數(shù)據(jù)中心里的數(shù)據(jù)能得到很好的保護,具有安全性,從而能夠探索將這些數(shù)據(jù)變成服務(wù),幫助創(chuàng)業(yè)公司創(chuàng)造價值。

比如說要做一個貸款的APP,不能只是依靠用戶填寫的幾樣數(shù)據(jù)就決定貸不貸,背后還要有整個征信數(shù)據(jù),包括出行數(shù)據(jù)、消費數(shù)據(jù)等等,它可能提交一個要求,讓背后大數(shù)據(jù)人工智能判斷這個人還款概率是多少,欺詐概率是多少,有否犯罪記錄,貸款給他壞賬概率是多少,這些都可以算清楚,而且并不需要暴露用戶隱私數(shù)據(jù)。

對于大數(shù)據(jù)一體化來說,整合各個方面的數(shù)據(jù)是非常重要的?,F(xiàn)在BAT三家公司都已經(jīng)一體化了,可以想象在阿里內(nèi)部,他們要來決定一個人的支付寶有沒有欺詐,或者這個人想買東西就推給他什么,這肯定是用上了集團所有數(shù)據(jù)。如果能做到更跨領(lǐng)域甚至國家級別的一體化,機會一定是更重大的。

第二是數(shù)據(jù)量需要非常多。數(shù)據(jù)收集是一個逐漸的過程。有些數(shù)據(jù)可能不能公開,有些公司數(shù)據(jù)可能需要保護隱私,但是可以用API做一個接口,不泄露數(shù)據(jù)。還有一些數(shù)據(jù)可能是要特別保護隱私,比如醫(yī)院診斷的個人數(shù)據(jù),可以幫助更多人更健康,更早地提醒患者或者是診斷出一些問題,可以產(chǎn)生很大價值。

這些數(shù)據(jù)怎樣整合起來?首先要有一個一體化數(shù)據(jù)中心。

谷歌成立了一家公司,旗下有100萬臺數(shù)據(jù)庫服務(wù)器,是世界上最大的一體化數(shù)據(jù)中心,它把所有數(shù)據(jù)加以利用,用在搜索就是谷歌,用在診斷就是谷歌健康,用在汽車就是無人駕駛……背后都是人工智能加上一體化大數(shù)據(jù)。

所有這些我們都要嘗試去做。雖然谷歌遠遠領(lǐng)先,BAT也做得不錯,但是我們還要提供給更多公司有這樣的數(shù)據(jù)資源。

三是計算資源。這對創(chuàng)業(yè)公司來說特別重要。APP時代,我們常說中國創(chuàng)業(yè)成本達到歷史新低,三個小朋友寫一些程序放到app商店就可以推出去了,幾十萬、一百萬元就可以創(chuàng)業(yè)了。很不幸,人工智能加大數(shù)據(jù),創(chuàng)業(yè)成本達到歷史新高,我們投資的一家公司,七個小朋友,沒有人超過三十歲,他們成立的第一天,就把我們打的款花完了,還只是買了一些機器,因為做的是無人駕駛。但我們不可能讓成千上萬的雙創(chuàng)項目都買機器。要把這些機器放在數(shù)據(jù)中心里,將CPU和GPU的功能很好結(jié)合,談個更好的采購價錢,不同的時段按照使用收費,這個也是未來大數(shù)據(jù)能夠提供的很大的潛在機會。

四是要培訓(xùn)大量人才。人工智能聽起來非常高深,但是培養(yǎng)一個人工智能工程師,需要多久呢?這么高深的技術(shù)也許至少要十年、二十年?做網(wǎng)絡(luò)安全的都是要有十五、二十年的工齡,做計算機網(wǎng)絡(luò)和其他的領(lǐng)域都要讀博士再做十年工作吧?實際上 ,一個優(yōu)秀的理工學(xué)生半年就可以成為AI工程師。應(yīng)該做一個更大的平臺培訓(xùn)年輕人,這個過程中還要有一體化的大數(shù)據(jù)平臺,不可能讓每個大學(xué)買幾百萬、上千萬的設(shè)備。

總而言之,人工智能加上大數(shù)據(jù)時代,我們需要做什么事情?一是需要讓這些機器能夠集合起來,實現(xiàn)一體化;二是把數(shù)據(jù)收起來,無論是公開的、授權(quán)的、消費的或者隱藏的、使用的;三是培養(yǎng)下一代,吸引海外頂尖的人回來帶著這些小朋友,讓他們能夠?qū)W習(xí)、成長。

創(chuàng)新工場看到了這些機會,正在策劃成立一個產(chǎn)業(yè)聯(lián)盟,在和相關(guān)部委溝通。這些事情要促成,一定是在北京,因為北京有中國最優(yōu)秀的大腦,最領(lǐng)先的人工智能技術(shù),北京也是創(chuàng)業(yè)的首府。我們非常希望把這個聯(lián)盟建立起來。在計算方面,數(shù)據(jù)中心方面,和北京供銷大數(shù)據(jù)集團合作,在購買大數(shù)據(jù)方面政府能提供多少,業(yè)界能買多少,能夠授權(quán)多少,我們希望也能統(tǒng)籌大數(shù)據(jù)這件事。在吸引海外頂尖人才和培養(yǎng)中國年輕優(yōu)秀小伙伴方面,我們也會準(zhǔn)備一個完整的計劃。

這幾件事情里特別核心的一件就是大數(shù)據(jù)中心和人工智能算法的整合。

今天我們也非常高興能夠和北京供銷大數(shù)據(jù)集團宣布一項合作,也希望得到各位的支持。

讓我們一起來引領(lǐng)人工智能和大數(shù)據(jù)時代的來臨。

 

分享到

xiesc

相關(guān)推薦