科大訊飛研究院副院長付瑞吉
付瑞吉:各位來賓大家下午好,首先非常感謝DOIT的邀請。我是來自科大訊飛AI研究院的付瑞吉,今天的題目就是人工智能技術(shù)的最新進(jìn)展和產(chǎn)業(yè)應(yīng)用,跟大家介紹一下科大訊飛這些年在人工智能領(lǐng)域的研究進(jìn)展和應(yīng)用。
我們都知道,從去年開始,阿爾法狗戰(zhàn)勝李世石,使得人工智能變成了一個家喻戶曉的概念,瑞銀集團(tuán)交易大廳以前坐滿了交易員,現(xiàn)在基本上是空了,人工智能已經(jīng)取代了交易員,完成一比一的交易。孫正義提出未來產(chǎn)業(yè)機(jī)器人將決定GDP的全球排名,我們以前講人口紅利,可能以后就是機(jī)器人紅利了,人工智能在全球范圍內(nèi)變成一個非常重要的戰(zhàn)略性的戰(zhàn)略高地。
迄今為止,工業(yè)界人工智能成功的經(jīng)驗(yàn),剛才提到了ABC成為主流,我們有深度學(xué)習(xí)算法,大數(shù)據(jù),計(jì)算能力,變成了一個人工智能里面的標(biāo)配,要想成功這三個方面必須得全部具備,在訊飛這些年來摸索產(chǎn)品階段,人工智能包括語音的這些產(chǎn)品成功經(jīng)驗(yàn)中,總結(jié)了這樣一條,我們叫聯(lián)誼效益,就像一滴水一塊石頭到湖面上泛起了漣漪,我們新的產(chǎn)品發(fā)布的時候有各種缺陷,準(zhǔn)確率沒有那么高,這個時候它的水波振幅非常大,代表了我們的錯誤率會比較高,但是總有一部分發(fā)燒友容忍度比較高的用戶會用我們的產(chǎn)品,這個時候會為我們貢獻(xiàn)真實(shí)的用后數(shù)據(jù),這些數(shù)據(jù)也用我們的云服務(wù)收集回來,幫助我們迭代的改進(jìn)我們的算法,形成這樣的閉環(huán),用用戶不斷的數(shù)據(jù)迭代改進(jìn)我們的算法,使得我們產(chǎn)品的準(zhǔn)確率提高,它的振幅變小,會吸引更多的人去利用,漣漪就會不斷的擴(kuò)大,直到覆蓋到整個湖面,使這個產(chǎn)品覆蓋更多的用戶。
訊飛總結(jié)了它的應(yīng)用模式,分為兩個方面,第一個方面,我們叫和自然交互去結(jié)合,自然交互改變生活,就是說我們可以跟智能家具和可穿戴設(shè)備包括智能汽車,我們知道現(xiàn)在越來越多的設(shè)備沒有屏幕,小型化,可穿戴,跟它交互的時候,以往像手機(jī)一樣的觸摸已經(jīng)不能滿足我們的需求,那么我們用更加自然的交互方式,用語音交互,更好的去使得交互更加的流暢。
和行業(yè)交互,更好的顛覆行業(yè),包括智慧城市和醫(yī)療等等,我們后面會看到各種的案例。
訊飛2014年開始定義了人工智能的三個階段。
第一個階段是計(jì)算智能,計(jì)算機(jī)可以算,這個是計(jì)算機(jī)誕生那一天就有優(yōu)勢,速度就是快,存儲的就是多,我們每天用的搜索引擎或者地圖搜索遠(yuǎn)遠(yuǎn)超過人類,這都是屬于計(jì)算智能。阿爾法狗一定意義也是計(jì)算智能。
第二個階段是感知智能,對應(yīng)的就是我們的能聽會說,能看會認(rèn),這個是類似所有動物都有的智能,都有視覺和聽覺。這個階段隨著深度學(xué)習(xí)的突飛猛進(jìn)的進(jìn)步,計(jì)算機(jī)的能力已經(jīng)越來越逼近人類,在某些任務(wù)上,已經(jīng)超過了人類。
第三個階段是認(rèn)知職能,能理解會思考,里面核心的就是人類語言的語境,人類語言包含信息非常豐富,里面涵蓋的知識也是非常的豐富,計(jì)算機(jī)如何理解語音,更好的為我們服務(wù),這個是我們現(xiàn)在人工智能所面臨的非常難的一個難題,也是各大研究機(jī)構(gòu)爭相研究的話題。
訊飛提出的這三個階段,基本作為業(yè)界公認(rèn)的共識。
我們看訊飛在這些年的研究進(jìn)展。
首先是感知智能方面,訊飛是做語音起家的,從99年創(chuàng)業(yè)開始,做語音的合成,實(shí)際就將文字轉(zhuǎn)化成流暢的語音,相當(dāng)于給機(jī)器撞上了嘴巴。訊飛現(xiàn)在的技術(shù)達(dá)到世界第一,從06年開始參加暴風(fēng)雪大賽,連續(xù)12年都是冠軍,現(xiàn)在可以做到非常流暢的去合出人的聲音,有不同的音色,有可能有人看到過奧巴馬的視頻。
第二個是語音識別技術(shù),相當(dāng)于撞上了人工的耳朵,不僅是要識別出語音中的內(nèi)容,還有說話人的識別語種識別等等,訊飛輸入法特別好,準(zhǔn)確率達(dá)到了98%。
還有訊飛獨(dú)創(chuàng)技術(shù),是語音的評測技術(shù),是我們從05年開始研究的,以往的口語考試都是老師評分,現(xiàn)在用機(jī)器評分,比人更加準(zhǔn)確,更加接近于專家的評分,所以在全國的普通話水平考試?yán)?,已?jīng)全面的應(yīng)用到了訊飛的技術(shù),在一些中高考的英語口語考試也在不斷的推廣應(yīng)用。
訊飛也做圖象識別,我們這里舉了一個例子,是手寫圖文識別,比如考試完以后,我們要對作文進(jìn)行識別,這里面的難度就是學(xué)生可能寫的字非常潦草,而且手機(jī)上的手寫輸入法沒有筆順的信息,訊飛基于大量的數(shù)據(jù),用深度神經(jīng)網(wǎng)絡(luò)端到端的學(xué)習(xí)已經(jīng)達(dá)到了國際領(lǐng)先的水平,已經(jīng)在教育和快遞單領(lǐng)域開始使用。
下面的例子就是在掃描閱卷里,我們首先掃描完了以后識別文字,進(jìn)行自動的評分,當(dāng)然后面自動評分的部分屬于認(rèn)知智能的部分,比如這個是英文的,我們會判斷它的語法錯誤,拼寫的錯誤,還有它的句子是不是流暢,還有它是不是地道等等,從各個方面去評價,最后給出一個分?jǐn)?shù),這個分?jǐn)?shù)我們同樣跟專家進(jìn)行了比較,我們的評分水平是更接近于專家的。
這個例子也是醫(yī)學(xué)領(lǐng)域的圖象識別,我們參加了醫(yī)學(xué)影響比賽,做的是肺部結(jié)節(jié)的檢測,X光片,這個結(jié)節(jié)可能是肺癌的征兆,我們都知道傳統(tǒng)來說這種片都是醫(yī)生用肉眼去看,經(jīng)常會有一些漏診,我們在一個北京的知名三甲醫(yī)院,醫(yī)生的閱片漏診率達(dá)到30%,本來可能他是有肺癌,醫(yī)生閱片的時候漏掉了,尤其是肺癌早期不明顯的情況下,給漏掉了,耽誤了最佳的治療時間,我們的閱片技術(shù)可以很好的解決這個問題,我們現(xiàn)在準(zhǔn)確率可以達(dá)到94%。
剛才講的是感知智能,2014年我們也依托于863的類答題項(xiàng)目提出訊飛超腦計(jì)劃,目標(biāo)就是讓機(jī)器人考上大學(xué),為人答題。我們這些年也有一些進(jìn)展,在知識圖譜的構(gòu)建有一些進(jìn)展,我們?nèi)ツ陞⒓恿吮荣?,這個比賽是給你一段話,讓你把中間的概念識別出來,鏈接數(shù)據(jù)庫對應(yīng)的試題里,里面最難的任務(wù)就是有一些重名,比如布什有重名,比如小布什,我們?nèi)〉玫牡谝幻?/p>
第二個例子,我們在斯坦福今年的機(jī)器閱讀理解任務(wù)上取得第一名,這個任務(wù)是非常火的,微軟還有臉書等等都在參加,給你一篇文章,讓后讓機(jī)器閱讀,之后提問題,讓機(jī)器回答,我們的準(zhǔn)確率是排在第一的。
大家都知道曉譯翻譯機(jī),現(xiàn)在可以支持中文到英文、法文和西班牙文等多種語言的相互翻譯,中國人出國旅游的時候非常方便,在京東多次斷貨。第二個產(chǎn)品,丁東音響,跟京東合作的國內(nèi)首款智能音響,把它放在客廳可以交互,獲得互聯(lián)網(wǎng)的內(nèi)容,也可以去控制智能家電,比如打開空調(diào)等等,第三個是阿爾法小蛋,是面向兒童的產(chǎn)品,可以跟小朋友進(jìn)行交流。第四個是曉曼機(jī)器人,可以做智慧導(dǎo)診,比如患者來了以后想找一個科室,找不到可以直接問機(jī)器人。
還有就是智慧城市,我們也是打通了各種大數(shù)據(jù),去做交通和公安等等,其實(shí)最終的目的是方便老百姓辦事,這是我們的理念,有一個例子,在杭州或者浙江某一個地方,老百姓辦事的效率從原來的需要10到20天的時間,縮短到了1到2天,原來需要跑2到3次,現(xiàn)在就一次搞定了。
機(jī)器人可以做人臉認(rèn)證,去替代柜臺的辦事人,幫你去開各種證明等等。
智慧教育方面,可以自動的閱卷,幫助老師減負(fù),幫助學(xué)生更好的批改作文,另一方面是個性學(xué)習(xí),每次考試完成以后,人工智能可以分析出你這個學(xué)生知識點(diǎn)的掌握情況,根據(jù)知識點(diǎn)的掌握情況去布置個性化的作業(yè),比如發(fā)現(xiàn)你某個知識點(diǎn)掌握的不好,這個時候可以布置這方面的作業(yè)多一些,對于那些掌握的比較好的知識點(diǎn),這方面就不需要做重復(fù)練習(xí)了,所以每次考試完了以后,每個人的課后的錯題作業(yè)都是不一樣的,都是個性化的,對于老師來說也是一樣的,可以分析出整個班級或者是整個年紀(jì)的情況,老師可以做針對性的教學(xué),實(shí)現(xiàn)因材施教。
智慧醫(yī)療大家都聽說了,今年我們機(jī)器人全球首次的通過的職業(yè)醫(yī)師資格考試,以456的高分通過,分?jǐn)?shù)線360,成績非常好,在安徽省內(nèi)達(dá)到5%以上的排名。我們是通過閱讀大量的醫(yī)學(xué)資料教科書以及很多的真實(shí)病例學(xué)習(xí)到的大量醫(yī)學(xué)知識,使得人工智能有一些醫(yī)學(xué)的能力,結(jié)合當(dāng)前的患者的信息去判斷到底可能是什么疾病,或者要做進(jìn)一步的什么檢查去確認(rèn),最終給出一些診療的方案。
最后,我們覺得一家的力量有限,我們把人工智能的能力統(tǒng)統(tǒng)打包到云平臺上,我們叫UI開放平臺,把人臉識別和語音合成以及手勢翻譯等等的能力放在云平臺上封裝起來,供廣大的開發(fā)者使用,現(xiàn)在支持的用戶數(shù)達(dá)到14億,人交互35億,支持的第三方開發(fā)者達(dá)到了43萬。
希望跟大家一起來在中國用人工智能改變世界,謝謝大家。