傅徐軍:非常感謝。大家眼里,百度是一個非常傳統(tǒng)的2C公司,是做搜索引擎的公司,正因為前兩年一直致力于把搜索引擎做得更好,所以在云計算和大數(shù)據(jù)兩個方面積累了非常堅實的基礎(chǔ),這兩年又在人工智能有非常重大的投入,所以我們在內(nèi)部叫ABC,怎么樣讓百度在這一方向轉(zhuǎn)型,怎么去更好的服務(wù)我們的行業(yè)客戶。今天也是借峰會的機會就這些方面的探索規(guī)劃做一些探討和互動。
百度的前任首席科學(xué)家是吳文達,他說如果人工智能是一個火箭,大數(shù)據(jù)就是燃料,發(fā)動機和云計算就是引擎,以前的云是1.0,現(xiàn)在是2.0,1.0的特征就是以資源分享為驅(qū)動,以業(yè)務(wù)升級為特征,2.0我們希望能為企業(yè)帶來更多的業(yè)務(wù)價值。當(dāng)ABC和產(chǎn)業(yè)結(jié)合的時候,我們覺得會發(fā)生兩種方式的變化。
第一種是漸進式的,我的產(chǎn)業(yè)和互聯(lián)網(wǎng)之間怎么融合,互聯(lián)網(wǎng)的技術(shù)可以快速的進入產(chǎn)業(yè),產(chǎn)業(yè)對行業(yè)的洞察可以給互聯(lián)網(wǎng)企業(yè)更多的視野,雙方會產(chǎn)生一定的化學(xué)反應(yīng),會創(chuàng)造新的商業(yè)模式。
第二種方式,革命性的創(chuàng)新,我們看到的一些對話式的人工智能產(chǎn)品,無人車、無人商城等等。
這兩種變化又會進一步的對IT的能力,對計算和數(shù)據(jù)的能力,提出非常大的挑戰(zhàn)。當(dāng)這個能力發(fā)生一些質(zhì)的變化,又會循環(huán)的回去促進我前面的兩個變化快速發(fā)生,直到越走越快。
百度在ABC方面的布局,無論是業(yè)務(wù)架構(gòu)還是組織架構(gòu)上,基本分為三大塊,一塊是度秘,第二塊是無人車,第三塊是百度云。
度秘在美國前兩年走得更快,我們知道蘋果的siri和亞馬遜的amzon,在國內(nèi)微軟小冰也火過,科大訊飛的靈犀,度秘是李彥宏起的,說每個人都希望有一個秘書,出門的時候訂飛機票,后來畢竟百度是一家互聯(lián)網(wǎng)公司,他們覺得這個取名太嚴肅了,所以我們從今年開始,整個度秘喚醒詞是小度。
怎么做好對話是人工智能助力的,百度有三個條件,聽得清,聽得懂,能滿足。
聽得清是語音識別能力,聽得懂是百度以前自然語言處理的能力,知識圖譜能力和搜索的推薦能力,聽得懂就是能滿足我真正要滿足用戶的需求,滿足終端客戶和終端用戶生活中工作中的小小要求。
我有一個小的demo,演示是讓人工智能的技術(shù)更好的理解上下文的語境、知道老百姓的大白話的表述。我們看到它可以簡單的記錄上下文的語境,可以進入十五輪對話左右,但是超過了就會丟失掉,下面的例子是一段視頻,度秘和智能家具合作的視頻,這個產(chǎn)品怎么在家居環(huán)境得到更好應(yīng)用,無論是冰箱孩子電視機,都可以作為智能對話的設(shè)備,未來不會再像以前的冷冰冰,而是做非常多的智能交互。
我們希望把智能對、話語音技術(shù)應(yīng)用到家庭的方方面面,因為百度本身是一個最大的搜索引擎知識庫,所以去問這是什么地方的時候,這個圖片被截屏,和內(nèi)部的百度百科或者百度知道幾百萬張酒店的圖片對比,得到正確的結(jié)果的時候,結(jié)果就會反饋到電視機上。還有你忘記這個明星是誰,他會告訴你是誰,這個是準(zhǔn)確率最高的。
百度的能力也非常有限,把生態(tài)做好,讓百度只要關(guān)心的關(guān)注語音識別和自然語言處理能力就可以了,所以我們做了一套系統(tǒng)多S的開放平臺。這個平臺也是在百度云之上,讓我們第三方合作伙伴可以非常把能力放在平臺上。
無人駕駛是非?;鸬姆较颍俣仍?014年就建立了無人駕駛事業(yè)部,2015年無人駕駛開上五環(huán),當(dāng)時的時速80公里每小時以上,天氣晴朗沒有紅綠燈和行人,相對來講是要求不那么高的環(huán)境,但是技術(shù)發(fā)展非常快,2016年10月烏鎮(zhèn)互聯(lián)網(wǎng)大會無人車開進了大會現(xiàn)場,當(dāng)時我們提供了18款車,品牌覆蓋比亞迪、QQ、奇瑞三種車型,所以這段路叫子葉路,是完全開放的道路,有行人和機動車紅綠燈等等。我想說百度無人車經(jīng)住了考驗,300多次試駕沒有一次發(fā)生問題,工程師也會發(fā)現(xiàn)一些問題,太陽太大的時候樹蔭會把白線遮住。
到了2017年,百度的內(nèi)部想法發(fā)生變化,他覺得靠百度一家想推動中國無人車發(fā)展非常難,怎么樣能夠調(diào)動所有人的積極性,調(diào)動合作伙伴的積極性和車廠積極性,更好更快的把無人車做得更好,百度推出阿波羅計劃,把無人車的代碼全部開源出,以后專注做無人車,幫助合作伙伴盡快的把實驗室環(huán)境的無人車放到生產(chǎn)環(huán)節(jié)。
(播放視頻)
阿波羅計劃推廣的非???,今年年底發(fā)布2.0版本,不同的阿波羅計劃更先進的版本使得我們的客戶調(diào)試代碼程度會大大的降低,調(diào)試的過程會很復(fù)雜,但是我們可以看到,隨著阿波羅計劃的推廣,使中國無人車的步伐大大的推動。
無人車也會開放平臺,這是一個軟硬件一體化的仿生平臺,一天可以平臺上跑幾百萬公里,這是由百度云內(nèi)部支持的。
講一下百度云,前面無人車和小度,都是非常專業(yè)的領(lǐng)域,小度對應(yīng)車聯(lián)網(wǎng)和智能家居,百度云是百度人工智能能力,拆成更小的力度,重新組合,針對不同的行業(yè)做各種優(yōu)化定制化的過程。
先給大家介紹一下智能媒體,它的底層能力是計算機視覺,我們今年1月份參加了江蘇衛(wèi)視最強大腦節(jié)目,這次是人類和小度PK,現(xiàn)場就有很多嘉賓和嘉賓小時候的照片,人跟計算機比拼現(xiàn)在的嘉賓和小時候的照片誰匹配得更準(zhǔn),百度以前沒有這個技術(shù)的,因為現(xiàn)在的人臉場景不管是一比一還是一比二,都是同年齡層的匹配,百度在內(nèi)部發(fā)布了兩萬名員工提交了自己的畢業(yè)照和成年照片,進行了大概一個月的訓(xùn)練,做了一個模型,所以比較微弱的優(yōu)勢戰(zhàn)勝了人類的最強選手,當(dāng)然百度做這個最早不是為了上綜藝節(jié)目,而是綜藝找到了我們,最早我們是和寶貝回家公益組織合作,我們希望天下無拐,我們跟兩萬七千個照片庫進行了對比,找到了幾十名走失的孩子,其中年齡差距最大的兩個,一個是20年,一個是17年,20年的那位是6歲的時候從重慶走失,我們在泉州發(fā)現(xiàn),警方進行DNA對比是一個人,也送他回了重慶,我覺得如果可以用技術(shù)做這樣的事情也是非常有意義的。
計算機視覺怎么和產(chǎn)業(yè)結(jié)合?我想舉一些例子,我們提供ABC一個完整的能力,最底層是視頻點播直播加速,中間是搜索系統(tǒng)推薦包括廣告營銷框架,最上層是內(nèi)部叫VCA、VCR,本質(zhì)就是對視頻進行圖片、語音的人臉場景識別,不需要靠人去看,而動態(tài)的識別圖片的內(nèi)容,這段視頻的內(nèi)容是什么東西。其中一個例子是我們跟CCTV共建創(chuàng)新實驗室,可以看到它的demo。
我們看到,通過語音識別,可以把食品里面的語音文字和人臉動態(tài)的抓出來。同步可以生成很多的標(biāo)簽,使原來計算機無法檢索的非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)變成結(jié)構(gòu)化數(shù)據(jù),大大提升搜索精度。對于廣電系統(tǒng)等,會大量的省去了人工編務(wù)的時間,以前需要人看幾個小時的視頻,非常累,現(xiàn)在通過計算機的方式可以大大的提升效率,準(zhǔn)確率80%左右,還是有很大提升空間,我相信人工智能和產(chǎn)業(yè)化學(xué)反應(yīng)會極大的推動技術(shù)的進步。
這個是我們跟蘇州市公安局一起合作的安防場景,第一天上線就抓到一個在逃三年時間的逃犯,他當(dāng)天戴著帽子和墨鏡,警察和百度的員工面對面看的時候也發(fā)現(xiàn)不是一個人,三四年的時間照片也不是最新的,可能匹配不上了,但是計算機有它獨特的視角做一個比人類更聰明的對比,因為現(xiàn)在我們發(fā)現(xiàn)某些情況人比計算機更好一些,但是有些情況計算機比人聰明。
鄭州的美蘭機場,每次登機之前要刷條形碼,導(dǎo)致排隊很長,裝了人臉閘機以后就不需要了,這塊也是計算機視覺的應(yīng)用;這是我們跟首都鋼鐵公司自動化技術(shù)公司合作的,它解決了工業(yè)缺陷審核的場景,很多的鋼材會有很小比例的誤品率,紅色鐵皮,孔洞,褶皺,怎么把這些這么小比例的鋼材找到?傳統(tǒng)的方式是用高速攝像機半毫秒拍一下,現(xiàn)在的解決方式是用國外的軟件,幾千萬一套,百度和首鋼有一些合作,我們花一個月時間對25萬張照片進行標(biāo)注,標(biāo)注用了一周時間,之后用深度學(xué)習(xí)進行訓(xùn)練。檢測速度很快,經(jīng)過實測試,準(zhǔn)確率是99.98%。
上面展示的只是我們跟各行各業(yè)合作的案例,百度本質(zhì)上是一個技術(shù)公司,很多時候是從技術(shù)去看行業(yè)的,比較傳統(tǒng),雖然它現(xiàn)在在不斷的改變自己的想法,應(yīng)該是看行業(yè)需要什么,怎么完善我的技術(shù),這是百度整個行業(yè)不斷的思考不斷規(guī)劃的一些東西,我今天也是拋磚引玉,希望跟在座各位有更多的合作機會。
由于金融的客戶相對對合作的保密性要求比較高,所以我不會給任何的案例,但是看得出來,我們跟金融的合作非常多,因為金融看上去是最穩(wěn)健要求最高的,同時它也永遠站在創(chuàng)新的最前沿,我們可以看到大概在九個方面可以有三四十個產(chǎn)品跟金融行業(yè)有非常多的合作,無論是知識圖譜還是企業(yè)輿情,可以幫助他們更好的去做貸中后前的管理,比如店鋪選擇和智慧選址,比如我現(xiàn)在有一個網(wǎng)點,人流其實是不夠清晰的,我不知道他們從什么地方來,也不知道他們?nèi)ミ^什么地方,可以基于百度地圖和百度搜索的數(shù)據(jù)給這個網(wǎng)點非常清晰的人流和熱力圖,當(dāng)然,我們不會給基于個人的信息。
再舉例子,比如信用卡的領(lǐng)域,大家知道信用卡盜卡和套卡養(yǎng)卡的問題比較嚴重,比方說營銷機構(gòu)買了身份證,去注冊我的信用卡信息,所有填寫的信息都是真實的,但是拿了卡以后不做正常的消費,過段時間銀行覺得我信用有錯,這個時候我錢套出來可能就消失掉了,公安部不會為幾萬塊錢立案,但是錢非常多也是非常恐怖的數(shù)字,我們是不是可以跳出來想想我們基于交易習(xí)慣或者信息也好,做一個機器學(xué)習(xí),讓機器訓(xùn)練去替代人的主觀上的專家系統(tǒng)和人的邏輯設(shè)計,我們做了這樣的事情,效果非常好,準(zhǔn)確率可以達到90%以上,我們記憶不的把這個模型做得更好。
這個是百度云的全家福,百度云有將近兩百個產(chǎn)品,有成熟的也有不太成熟的,這邊是相對成熟的一部分,我們會分為幾塊,產(chǎn)品的解決方案和行業(yè)的解決方案,也歡迎各位在任何時間找我做任何交流,謝謝大家。