科大訊飛研究院副院長付瑞吉
付瑞吉:各位來賓大家下午好,首先非常感謝DOIT的邀請。我是來自科大訊飛AI研究院的付瑞吉,今天的題目就是人工智能技術的最新進展和產業(yè)應用,跟大家介紹一下科大訊飛這些年在人工智能領域的研究進展和應用。
我們都知道,從去年開始,阿爾法狗戰(zhàn)勝李世石,使得人工智能變成了一個家喻戶曉的概念,瑞銀集團交易大廳以前坐滿了交易員,現在基本上是空了,人工智能已經取代了交易員,完成一比一的交易。孫正義提出未來產業(yè)機器人將決定GDP的全球排名,我們以前講人口紅利,可能以后就是機器人紅利了,人工智能在全球范圍內變成一個非常重要的戰(zhàn)略性的戰(zhàn)略高地。
迄今為止,工業(yè)界人工智能成功的經驗,剛才提到了ABC成為主流,我們有深度學習算法,大數據,計算能力,變成了一個人工智能里面的標配,要想成功這三個方面必須得全部具備,在訊飛這些年來摸索產品階段,人工智能包括語音的這些產品成功經驗中,總結了這樣一條,我們叫聯(lián)誼效益,就像一滴水一塊石頭到湖面上泛起了漣漪,我們新的產品發(fā)布的時候有各種缺陷,準確率沒有那么高,這個時候它的水波振幅非常大,代表了我們的錯誤率會比較高,但是總有一部分發(fā)燒友容忍度比較高的用戶會用我們的產品,這個時候會為我們貢獻真實的用后數據,這些數據也用我們的云服務收集回來,幫助我們迭代的改進我們的算法,形成這樣的閉環(huán),用用戶不斷的數據迭代改進我們的算法,使得我們產品的準確率提高,它的振幅變小,會吸引更多的人去利用,漣漪就會不斷的擴大,直到覆蓋到整個湖面,使這個產品覆蓋更多的用戶。
訊飛總結了它的應用模式,分為兩個方面,第一個方面,我們叫和自然交互去結合,自然交互改變生活,就是說我們可以跟智能家具和可穿戴設備包括智能汽車,我們知道現在越來越多的設備沒有屏幕,小型化,可穿戴,跟它交互的時候,以往像手機一樣的觸摸已經不能滿足我們的需求,那么我們用更加自然的交互方式,用語音交互,更好的去使得交互更加的流暢。
和行業(yè)交互,更好的顛覆行業(yè),包括智慧城市和醫(yī)療等等,我們后面會看到各種的案例。
訊飛2014年開始定義了人工智能的三個階段。
第一個階段是計算智能,計算機可以算,這個是計算機誕生那一天就有優(yōu)勢,速度就是快,存儲的就是多,我們每天用的搜索引擎或者地圖搜索遠遠超過人類,這都是屬于計算智能。阿爾法狗一定意義也是計算智能。
第二個階段是感知智能,對應的就是我們的能聽會說,能看會認,這個是類似所有動物都有的智能,都有視覺和聽覺。這個階段隨著深度學習的突飛猛進的進步,計算機的能力已經越來越逼近人類,在某些任務上,已經超過了人類。
第三個階段是認知職能,能理解會思考,里面核心的就是人類語言的語境,人類語言包含信息非常豐富,里面涵蓋的知識也是非常的豐富,計算機如何理解語音,更好的為我們服務,這個是我們現在人工智能所面臨的非常難的一個難題,也是各大研究機構爭相研究的話題。
訊飛提出的這三個階段,基本作為業(yè)界公認的共識。
我們看訊飛在這些年的研究進展。
首先是感知智能方面,訊飛是做語音起家的,從99年創(chuàng)業(yè)開始,做語音的合成,實際就將文字轉化成流暢的語音,相當于給機器撞上了嘴巴。訊飛現在的技術達到世界第一,從06年開始參加暴風雪大賽,連續(xù)12年都是冠軍,現在可以做到非常流暢的去合出人的聲音,有不同的音色,有可能有人看到過奧巴馬的視頻。
第二個是語音識別技術,相當于撞上了人工的耳朵,不僅是要識別出語音中的內容,還有說話人的識別語種識別等等,訊飛輸入法特別好,準確率達到了98%。
還有訊飛獨創(chuàng)技術,是語音的評測技術,是我們從05年開始研究的,以往的口語考試都是老師評分,現在用機器評分,比人更加準確,更加接近于專家的評分,所以在全國的普通話水平考試里,已經全面的應用到了訊飛的技術,在一些中高考的英語口語考試也在不斷的推廣應用。
訊飛也做圖象識別,我們這里舉了一個例子,是手寫圖文識別,比如考試完以后,我們要對作文進行識別,這里面的難度就是學生可能寫的字非常潦草,而且手機上的手寫輸入法沒有筆順的信息,訊飛基于大量的數據,用深度神經網絡端到端的學習已經達到了國際領先的水平,已經在教育和快遞單領域開始使用。
下面的例子就是在掃描閱卷里,我們首先掃描完了以后識別文字,進行自動的評分,當然后面自動評分的部分屬于認知智能的部分,比如這個是英文的,我們會判斷它的語法錯誤,拼寫的錯誤,還有它的句子是不是流暢,還有它是不是地道等等,從各個方面去評價,最后給出一個分數,這個分數我們同樣跟專家進行了比較,我們的評分水平是更接近于專家的。
這個例子也是醫(yī)學領域的圖象識別,我們參加了醫(yī)學影響比賽,做的是肺部結節(jié)的檢測,X光片,這個結節(jié)可能是肺癌的征兆,我們都知道傳統(tǒng)來說這種片都是醫(yī)生用肉眼去看,經常會有一些漏診,我們在一個北京的知名三甲醫(yī)院,醫(yī)生的閱片漏診率達到30%,本來可能他是有肺癌,醫(yī)生閱片的時候漏掉了,尤其是肺癌早期不明顯的情況下,給漏掉了,耽誤了最佳的治療時間,我們的閱片技術可以很好的解決這個問題,我們現在準確率可以達到94%。
剛才講的是感知智能,2014年我們也依托于863的類答題項目提出訊飛超腦計劃,目標就是讓機器人考上大學,為人答題。我們這些年也有一些進展,在知識圖譜的構建有一些進展,我們去年參加了比賽,這個比賽是給你一段話,讓你把中間的概念識別出來,鏈接數據庫對應的試題里,里面最難的任務就是有一些重名,比如布什有重名,比如小布什,我們取得的第一名。
第二個例子,我們在斯坦福今年的機器閱讀理解任務上取得第一名,這個任務是非?;鸬模④涍€有臉書等等都在參加,給你一篇文章,讓后讓機器閱讀,之后提問題,讓機器回答,我們的準確率是排在第一的。
大家都知道曉譯翻譯機,現在可以支持中文到英文、法文和西班牙文等多種語言的相互翻譯,中國人出國旅游的時候非常方便,在京東多次斷貨。第二個產品,丁東音響,跟京東合作的國內首款智能音響,把它放在客廳可以交互,獲得互聯(lián)網的內容,也可以去控制智能家電,比如打開空調等等,第三個是阿爾法小蛋,是面向兒童的產品,可以跟小朋友進行交流。第四個是曉曼機器人,可以做智慧導診,比如患者來了以后想找一個科室,找不到可以直接問機器人。
還有就是智慧城市,我們也是打通了各種大數據,去做交通和公安等等,其實最終的目的是方便老百姓辦事,這是我們的理念,有一個例子,在杭州或者浙江某一個地方,老百姓辦事的效率從原來的需要10到20天的時間,縮短到了1到2天,原來需要跑2到3次,現在就一次搞定了。
機器人可以做人臉認證,去替代柜臺的辦事人,幫你去開各種證明等等。
智慧教育方面,可以自動的閱卷,幫助老師減負,幫助學生更好的批改作文,另一方面是個性學習,每次考試完成以后,人工智能可以分析出你這個學生知識點的掌握情況,根據知識點的掌握情況去布置個性化的作業(yè),比如發(fā)現你某個知識點掌握的不好,這個時候可以布置這方面的作業(yè)多一些,對于那些掌握的比較好的知識點,這方面就不需要做重復練習了,所以每次考試完了以后,每個人的課后的錯題作業(yè)都是不一樣的,都是個性化的,對于老師來說也是一樣的,可以分析出整個班級或者是整個年紀的情況,老師可以做針對性的教學,實現因材施教。
智慧醫(yī)療大家都聽說了,今年我們機器人全球首次的通過的職業(yè)醫(yī)師資格考試,以456的高分通過,分數線360,成績非常好,在安徽省內達到5%以上的排名。我們是通過閱讀大量的醫(yī)學資料教科書以及很多的真實病例學習到的大量醫(yī)學知識,使得人工智能有一些醫(yī)學的能力,結合當前的患者的信息去判斷到底可能是什么疾病,或者要做進一步的什么檢查去確認,最終給出一些診療的方案。
最后,我們覺得一家的力量有限,我們把人工智能的能力統(tǒng)統(tǒng)打包到云平臺上,我們叫UI開放平臺,把人臉識別和語音合成以及手勢翻譯等等的能力放在云平臺上封裝起來,供廣大的開發(fā)者使用,現在支持的用戶數達到14億,人交互35億,支持的第三方開發(fā)者達到了43萬。
希望跟大家一起來在中國用人工智能改變世界,謝謝大家。