唐文彬:大家好,我是來(lái)自face++的唐文彬。
大家對(duì)于我們的理解停留在face++,其實(shí)我們名字并不叫face++,我們名字叫Vision Revolution,我們想做的事情,是讓機(jī)器看懂這個(gè)世界。為什么說(shuō)我們叫face++呢?因?yàn)榇笠曈X(jué)這個(gè)事情,在開(kāi)始的時(shí)候,很難講一個(gè)大的夢(mèng)想。連馬云都說(shuō),這個(gè)夢(mèng)想萬(wàn)一實(shí)現(xiàn)呢?所以我們讓face++成為我們起點(diǎn),讓機(jī)器先看懂face,未來(lái)讓機(jī)器看懂更多的東西。咱們這個(gè)會(huì)更多是在說(shuō)大數(shù)據(jù)的事情,我們現(xiàn)在很多說(shuō)的大數(shù)據(jù),指的是那一些可以被結(jié)構(gòu)化被數(shù)據(jù)化,被量化被計(jì)算機(jī)處理的數(shù)據(jù)的舉個(gè)例子,比如說(shuō)你在網(wǎng)上看一個(gè)頁(yè)面的時(shí)候,跳轉(zhuǎn)到下一個(gè)頁(yè)面的概率是多少,這個(gè)地方用戶量有多少,都是這樣的數(shù)據(jù),但是實(shí)際上我想說(shuō),這一些量化,已經(jīng)被量化的數(shù)據(jù),其實(shí)只是大數(shù)據(jù)的冰山一角,還有非常大的數(shù)據(jù)其實(shí)在我們生活當(dāng)中,舉個(gè)例子,現(xiàn)在在場(chǎng)這么多的人當(dāng)中有多少人低頭看手機(jī),一定程度上反應(yīng)我演講有多無(wú)聊。就是數(shù)據(jù)存在拿來(lái),但是并沒(méi)有被量化沒(méi)有被分析。
我這里有一張圖,左邊是科幻美劇里面的圖。每個(gè)經(jīng)過(guò)的人,他的面部標(biāo)清、穿衣是什么樣的,包含非常多的數(shù)據(jù)。包括路口里面開(kāi)的車,這個(gè)車?yán)锩孀氖裁慈?,這個(gè)人做什么樣的事情,包括體育比賽當(dāng)中,有很多的數(shù)據(jù),這些數(shù)據(jù)我們很難用大數(shù)據(jù)的方法被處理。因?yàn)樗F(xiàn)在只是一個(gè)視頻的數(shù)據(jù),很難把它歸結(jié)成一個(gè)一個(gè)的條度,變成計(jì)算機(jī)可以處理的數(shù)據(jù)。所以我們要把非結(jié)構(gòu)化的數(shù)據(jù)能夠看懂,能夠變成大結(jié)構(gòu)化的方法,增加機(jī)器的智商,成為智能的機(jī)器。我們想到人是怎么捕獲數(shù)據(jù)的??康氖俏骞?。人獲得信息更多是通過(guò)眼睛。我們想,機(jī)器能不能像人一樣擁有眼睛。比如我看到這個(gè)信息,比如我看到前面兩排沙發(fā),知道前面的嘉賓都溜了,但是后面的同學(xué)還在。
我們這家公司想做大的視覺(jué),但是這個(gè)夢(mèng)想太大了,我們很難讓機(jī)器一上來(lái)就看懂?dāng)?shù)據(jù)的能力。所以我們希望從高價(jià)值的開(kāi)始,讓機(jī)器先看懂這些高價(jià)值的物體,我們?nèi)似綍r(shí)在看哪一些東西呢?我想這幾個(gè)東西大概涵蓋了我們平時(shí)生活當(dāng)中主要看到的物體,我們大不時(shí)間在看人的臉,包括小孩會(huì)說(shuō)的第一句話喊爸爸喊媽媽,是對(duì)著那張臉來(lái)說(shuō)的。然后我們會(huì)去看人,會(huì)去看車,讀書,看文字。還會(huì)看我們現(xiàn)在處在什么樣的一個(gè)場(chǎng)景。這五個(gè)要素形成了在視覺(jué)里面,叫做,就是信息量最大,但是量又比較少五個(gè)單點(diǎn),如果解決了這五個(gè)單點(diǎn),就解決了大部分的場(chǎng)景。
我們公司是希望機(jī)器能了解世界。我們第一個(gè)開(kāi)放平臺(tái)是face++。開(kāi)始是希望看懂人臉,第二個(gè)是希望看懂圖象,包括第二個(gè)高價(jià)值的品類。未來(lái)我們還會(huì)推出,因?yàn)槠鋵?shí)還有一些動(dòng)作不是靠一兩張圖象就能表示出來(lái)的。舉個(gè)例子說(shuō),當(dāng)我兩只手分開(kāi),合攏,再分開(kāi),這個(gè)是視頻里面一系列的動(dòng)作,形成了拍手或者是故障,這個(gè)是我們的VIDO++,這個(gè)是我們的技術(shù)路線。千里之行始于足下,我們希望機(jī)器能看懂很多的東西,我們希望機(jī)器先進(jìn)行第一步,先看懂人臉??炊四樉涂梢越鉀Q很多問(wèn)題,比如剛剛說(shuō)到,人臉可以幫助走失兒童。我想說(shuō)這個(gè)技術(shù)特別難,我們解決得也不好。因?yàn)樾『⒌哪樆旧鲜菆A乎乎的樣子,他明天跟今天還不太一樣,因?yàn)樾『㈤L(zhǎng)得太快了。還有非常多的應(yīng)用場(chǎng)景,包括可以幫助大家在美圖的時(shí)候,幫助大家把眼睛放大一點(diǎn),而不是把鼻子放大一點(diǎn),可以幫助大家在數(shù)據(jù)里面找到與你喜好合適的妹子或者是帥哥??梢詭椭蠹易鼍€上的身份認(rèn)證。我們也可以幫助這種叫做安防的場(chǎng)景,使得可以有這種黑名單或者是白名單的識(shí)別的能力,包括可以放在公司或者是小區(qū),變成門禁,大家不用老帶門禁那張卡了。也可以在辦公室里面對(duì)于重要人物做的迎賓。我們可以做非常多的場(chǎng)景。我想說(shuō)的這個(gè)是我們的第一步,通過(guò)看懂人臉的第一步,未來(lái)能夠具備更多看懂其他東西的能力,從而讓機(jī)器能看懂世界。
最后今天非常有幸跟七牛有個(gè)合作,七牛上有非常多的圖象的數(shù)據(jù),我們希望在七牛上讓七牛也能有看懂人臉的能力。謝謝大家。