從產(chǎn)業(yè)角度看,從政府到企業(yè)到人民百姓,發(fā)展數(shù)字經(jīng)濟(jì)成為各方認(rèn)可的方向。那么,在人工智能應(yīng)用爆發(fā)、數(shù)字中國建設(shè)高峰期,人工智能領(lǐng)域還需要實(shí)現(xiàn)哪些技術(shù)突破?如何領(lǐng)跑數(shù)字經(jīng)濟(jì)?
人機(jī)大戰(zhàn)再次升級(jí)
此次斗詩是人機(jī)大戰(zhàn)的升級(jí),是一場人類高手與AI作詩的較量,更是一次人工智能認(rèn)知層的突破。
相較以往的人機(jī)大賽,無論是圍棋大戰(zhàn)還是德州撲克對(duì)決,大都是基于數(shù)據(jù)驅(qū)動(dòng),是隨著算法和計(jì)算力的提升而取得的機(jī)器勝利。
然而目前在語義理解上,突破者甚少。百分點(diǎn)將深度學(xué)習(xí)引入到自然語言處理技術(shù)中,并結(jié)合動(dòng)態(tài)知識(shí)圖譜,基于對(duì)80萬首詩詞文章的學(xué)習(xí),可根據(jù)不用的語境智能生成唐詩以及五十多個(gè)詞牌的宋詞,對(duì)傳統(tǒng)文化與最新的人工智能技術(shù)進(jìn)行了創(chuàng)新融合。
實(shí)際上,AI李白的首次曝光是在春節(jié)期間,主要圍繞新年送祝福主題。此次峰會(huì)上展出了第二個(gè)版本,不僅可以讓人體會(huì)到“一秒變李白”的神奇,還能與人互動(dòng)對(duì)“飛花令”,將《中國詩詞大會(huì)》由線上轉(zhuǎn)到線下真實(shí)場景中,讓人工智能應(yīng)用普惠到更廣泛人群中。并且更好玩有趣,機(jī)器人可識(shí)別觀眾語音,根據(jù)語音生成個(gè)性化的詩和詞。
也因此,在人民日報(bào)旗下人民直播平臺(tái)上,全程直播了這場AI李白挑戰(zhàn)雷海為的斗詩賽,結(jié)果不出意料,人類高手雷海為贏得比賽。直播的同時(shí),基于樂調(diào)查的實(shí)時(shí)在線投票中,支持AI李白的觀眾反而占了一多半。
對(duì)此,百分點(diǎn)董事長兼CEO蘇萌博士認(rèn)為,在即興創(chuàng)作詩詞的挑戰(zhàn)賽中,人機(jī)各領(lǐng)風(fēng)騷。在全文邏輯和情感細(xì)膩度上,人類高手更勝一籌;在寫作效率和短文本的用詞上機(jī)器后來居上。
經(jīng)典古詩詞是語言中的精華,充滿人類情感,可以使語言思維得以升華。這就如同AI李白,也是通過NLP和知識(shí)圖譜對(duì)古典詩詞進(jìn)行語義理解,自動(dòng)學(xué)習(xí)發(fā)現(xiàn)詩詞中的特征和規(guī)律,捕獲上下文復(fù)雜的語言依賴關(guān)系,從而訓(xùn)練出智能作詩的模型。未來在深度學(xué)習(xí)算法持續(xù)升級(jí)換代后,系統(tǒng)也會(huì)持續(xù)進(jìn)行自學(xué)習(xí)、自優(yōu)化。
蘇萌博士表示,這場斗詩賽,意味著機(jī)器已經(jīng)走進(jìn)藝術(shù)領(lǐng)域,可以理解人類,進(jìn)行一些創(chuàng)造性突破。希望今后可以用大規(guī)模盲測的方式量化評(píng)估人與機(jī)器的詩詞創(chuàng)作水平。
未來突破
AI正在以人類無法想象的速度演進(jìn)。
最近幾年,隨著大數(shù)據(jù)技術(shù)、算法以及GPU計(jì)算能力的大幅度提升,使得神經(jīng)網(wǎng)絡(luò)的計(jì)算效率得到了顯著的提升,深度學(xué)習(xí)在圖像、人臉識(shí)別等感知層已經(jīng)實(shí)現(xiàn)明顯突破,比如峰會(huì)現(xiàn)場“刷臉”入場采用的人臉識(shí)別技術(shù),其準(zhǔn)確度高達(dá)99.7%,已超越人類。
蘇萌博士認(rèn)為,智能是解決實(shí)際問題的智能,智能進(jìn)化三部曲包括感知、認(rèn)知、決策,其中智能決策是其終極智能。然而,從感知到認(rèn)知再到?jīng)Q策,每一步突破都會(huì)越來越難。尤其是NLP被比爾?蓋茨形容為“人工智能皇冠上的明珠”,處于認(rèn)知智能最核心的地位,一旦技術(shù)突破將會(huì)推動(dòng)人工智能整體的進(jìn)展。
但是目前,NLP目前依然處于基于淺層語義的分析階段,缺少對(duì)現(xiàn)實(shí)的理解及對(duì)現(xiàn)實(shí)通用知識(shí)的掌握,在效果提升上已遇明顯瓶頸。
百分點(diǎn)早在2016年將深度學(xué)習(xí)引入自然語言處理上后已意識(shí)到此問題,便著手在知識(shí)圖譜結(jié)合自然語言上進(jìn)行探索研發(fā)。目前百分點(diǎn)在分詞識(shí)別準(zhǔn)確度已經(jīng)達(dá)到98.97%、實(shí)體識(shí)別準(zhǔn)確度達(dá)到91.45%,已走在了行業(yè)前沿。通過自然語言處理技術(shù),理解人類的語言、思維,語言是人類文明傳承的載體,一旦機(jī)器學(xué)會(huì)人類語言思維,可以推動(dòng)知識(shí)圖譜的進(jìn)一步發(fā)展,機(jī)器可以更好的“讀懂”人類。
此次斗詩大賽,說明了百分點(diǎn)在自然語言生成技術(shù)(NLG)方面實(shí)現(xiàn)了突破,也是人民日報(bào)社聯(lián)合百分點(diǎn)引領(lǐng)國內(nèi)媒體率先探索智能采編業(yè)務(wù)的體現(xiàn)。在認(rèn)知層,百分點(diǎn)將持續(xù)投入研發(fā),實(shí)現(xiàn)更多突破。
在會(huì)上,人民日報(bào)數(shù)字傳播有限公司董事長徐濤表示,已與百分點(diǎn)達(dá)成深度戰(zhàn)略合作關(guān)系,希望將百分點(diǎn)在人工智能領(lǐng)域的突破性技術(shù)應(yīng)用到人民日報(bào)數(shù)字屏幕上,給社會(huì)提供更多的數(shù)字文化產(chǎn)品。
各種人機(jī)頻繁上演的背后,實(shí)際上是意味著我們已經(jīng)進(jìn)入到人機(jī)共生的未來社會(huì)新常態(tài)。如果說90后屬于互聯(lián)網(wǎng)原住民,那么現(xiàn)在的青少年,就是人工智能爆發(fā)期的原住民。因此,展館中處處可以看到“帶娃參會(huì)”的場景,更有中小學(xué)校組織學(xué)生來參觀。
未來,AI2.0時(shí)代產(chǎn)生的各種應(yīng)用產(chǎn)品,會(huì)讓人類生活更加美好,另一方面,不善于使用人工智能的,會(huì)真正被同齡人拋棄。
領(lǐng)跑數(shù)字化轉(zhuǎn)型
在峰會(huì)主論壇上,國家網(wǎng)信辦發(fā)布了《數(shù)字中國建設(shè)發(fā)展報(bào)告(2017年)》。報(bào)告指出,我國數(shù)字經(jīng)濟(jì)規(guī)模已經(jīng)位居全球第二,尤其是“互聯(lián)網(wǎng)+政務(wù)”讓人民群眾獲得感顯著增強(qiáng)。無論是政策層還是實(shí)際應(yīng)用場景都已明晰,未來將進(jìn)入加速跑階段。
那么需要思考的是,如何才能領(lǐng)跑?在數(shù)字中國建設(shè)進(jìn)入高峰期之時(shí),所處的是數(shù)據(jù)密集型和知識(shí)密集型時(shí)代,數(shù)據(jù)是數(shù)字經(jīng)濟(jì)最基本的物質(zhì)基礎(chǔ),人工智能技術(shù)是其技術(shù)手段,以其為代表的新一代信息技術(shù)將成為拉動(dòng)數(shù)字經(jīng)濟(jì)的新動(dòng)能。
百分點(diǎn)自2015年開始深耕數(shù)字化轉(zhuǎn)型,為解決企業(yè)機(jī)構(gòu)實(shí)際問題,基于大數(shù)據(jù)全棧技術(shù)和人工智能認(rèn)知技術(shù)進(jìn)行雙輪驅(qū)動(dòng),通過語義理解將信息知識(shí)化,從語義到知識(shí),最終支撐政府進(jìn)行智能決策。
目前,百分點(diǎn)已經(jīng)覆蓋主流媒體出版機(jī)構(gòu)、政府公務(wù)事務(wù)、智能制造、零售等龍頭企業(yè),并建設(shè)了海外國家級(jí)大數(shù)據(jù)和人工智能平臺(tái),是國內(nèi)實(shí)體經(jīng)濟(jì)數(shù)字化轉(zhuǎn)型和數(shù)字經(jīng)濟(jì)國際合作方面的先行者。