郭律:大家下午好,非常榮幸有機(jī)會(huì)可以來(lái)分享騰訊云對(duì)于AI、AI在產(chǎn)業(yè)中的落地,應(yīng)用開(kāi)發(fā)中的落地,以及關(guān)于騰訊的一些觀點(diǎn)。
我叫郭律,來(lái)自于騰訊,騰訊云智天樞人工智能服務(wù)平臺(tái),是這個(gè)平臺(tái)產(chǎn)品架構(gòu)師。這個(gè)平臺(tái)目標(biāo)講其實(shí)是用于解決AI應(yīng)用開(kāi)發(fā)出來(lái)到最后應(yīng)用開(kāi)發(fā)中,就從AI模型訓(xùn)練出來(lái)到最后應(yīng)用開(kāi)發(fā)好以后,然后投入生產(chǎn)中使用后一公里,我們是目標(biāo)為了這個(gè)里面的一些問(wèn)題。
今天的交流主要分為三個(gè)部分:第一部分談一下對(duì)產(chǎn)業(yè)+AI的理解,今天的主題是說(shuō)AI應(yīng)用的落地,就是說(shuō)如何把AI在產(chǎn)業(yè)中用起來(lái),那就是產(chǎn)業(yè)+AI的理解。第二,企業(yè)在做AI應(yīng)用的落地中,我們發(fā)現(xiàn)的在AI產(chǎn)業(yè)落地中可能跟數(shù)據(jù)有關(guān)的一些難點(diǎn)。第三,結(jié)合自己在實(shí)際的應(yīng)用開(kāi)發(fā)中發(fā)現(xiàn)的這些難點(diǎn)如何解決,最后沉淀下來(lái)去做這樣一個(gè)工具來(lái)解決這一塊的問(wèn)題。
首先來(lái)講智慧產(chǎn)業(yè)在企業(yè)數(shù)字化轉(zhuǎn)型。我們認(rèn)為是這其實(shí)就是一個(gè)趨勢(shì)。早年的時(shí)候,最開(kāi)始英國(guó)工業(yè)革命機(jī)械化、自動(dòng)化,接下來(lái)2000年初的時(shí)候,計(jì)算機(jī)普及、信息化、然后互聯(lián)網(wǎng)化、移動(dòng)互聯(lián)網(wǎng)化,到現(xiàn)在這個(gè)階段2016年開(kāi)始,智能化慢慢普及起來(lái)了。我認(rèn)為這是我們?cè)谶@個(gè)事情大的背景。
具體而言的話,我們認(rèn)為其實(shí)企業(yè)里面AI用能到地方方方面面,包括產(chǎn)品生產(chǎn),如何去降低研發(fā)成本。我們之前幫制藥的企業(yè)做藥物的分子,然后再做設(shè)計(jì)的時(shí)候需要做精心設(shè)計(jì),這個(gè)時(shí)候用人工智能模擬不同的機(jī)型,可以大大降低藥物研發(fā)的成本,加快研發(fā)的速度。這是在產(chǎn)品設(shè)計(jì)生產(chǎn)的時(shí)候有幫助一些工業(yè)的企業(yè)通過(guò)這個(gè)圖象識(shí)別的技術(shù)做一些缺陷檢測(cè)這樣的功能。
在營(yíng)銷(xiāo)、物流領(lǐng)域,現(xiàn)在推薦個(gè)性化的廣告這個(gè)事情非常多了。其實(shí)我們就認(rèn)為做這個(gè)事情生產(chǎn)各個(gè)方面都是可以人工智能,具體怎么用,我們可以看到在能看到企業(yè)的IA應(yīng)用中幾個(gè)類(lèi)型:
第一種類(lèi)似是計(jì)算機(jī)代替人的眼睛和耳朵來(lái)看和聽(tīng)。這種具體應(yīng)用很明顯,圖象識(shí)別、語(yǔ)音識(shí)別、這些都是屬于看和聽(tīng)。自然語(yǔ)言理解,讓計(jì)算機(jī)去懂,獲得外界非結(jié)構(gòu)化的信息可以理解下來(lái)。
第二塊應(yīng)用就是智能交互,就是除了看,除了聽(tīng)以外,還能給出一些反饋。比方說(shuō)目前比較火的機(jī)器人,包括知識(shí)圖譜有很多這樣的一些功能,去獲得外界一些信息,然后去根據(jù)外界信息通過(guò)計(jì)算機(jī)自己去判斷,然后給出反饋。
第三塊,智能決策。就是說(shuō)主要是指除了可以獲得信息,反饋信息基于獲得和反饋重新獲得這些信息做一些決策和判斷,比較類(lèi)似于銀行做的信用卡支付反欺詐,包括工業(yè)做一些工業(yè)設(shè)備的預(yù)測(cè)性維護(hù),這些事情其實(shí)都是屬于我們認(rèn)為計(jì)算機(jī)做決策這樣的實(shí)例。
總體而言,AI可以來(lái)幫忙產(chǎn)業(yè)做提升。具體怎么提提升法?總結(jié)下來(lái)三點(diǎn):降本增效、創(chuàng)新,后面會(huì)一一用例子解釋什么叫降本,怎么叫創(chuàng)新?
第一個(gè)降本的例子,降本增效和創(chuàng)新對(duì)于企業(yè)而言應(yīng)該一個(gè)從低層次的訴求向高層次訴求往上走,現(xiàn)在可能降本增效多一些,創(chuàng)新的會(huì)少一點(diǎn),但是我們相信后面會(huì)越來(lái)越多。
降本這一塊,幫保險(xiǎn)公司做智能和保的案例,具體怎么來(lái)做?在以往的時(shí)候保險(xiǎn)公司里面如果集中運(yùn)營(yíng)的中心經(jīng)常會(huì)有大量的人去錄保單,做初審判斷這些事情。除了報(bào)單信息以外還有很多壽險(xiǎn)提醒報(bào)告,還有醫(yī)院診斷通知書(shū)一類(lèi)的內(nèi)容。對(duì)于保險(xiǎn)公司而言量太大,每個(gè)信息收集回來(lái)的話,成本太高了。對(duì)于保險(xiǎn)公司怎么做?就是拿到這些報(bào)告,把認(rèn)為幾個(gè)點(diǎn)或者是十幾個(gè)點(diǎn)信息收購(gòu)錄進(jìn)來(lái),提交一份報(bào)告采集出來(lái)結(jié)構(gòu)化信息有價(jià)值的信息,大概有2000項(xiàng)。也就是說(shuō)100倍及保險(xiǎn)公司因?yàn)槌杀镜南拗疲赡軄G失掉100倍的有用的信息,全部堆在檔案庫(kù)里面。
做智能核保的時(shí)候,我們主要用了OCR+NLP+分類(lèi)引擎,相當(dāng)于除了保單信息進(jìn)來(lái)以后,把體檢這些其他的信息全部都結(jié)構(gòu)化,再做一個(gè)大的核保引擎,錄進(jìn)去全部信息,通過(guò)模型去算。下面有例子,最左邊的圖實(shí)際就是結(jié)構(gòu)化出來(lái)的信息,外邊是體檢報(bào)告。這邊是健康的建議,比方說(shuō)有什么風(fēng)險(xiǎn)是無(wú),還是低風(fēng)險(xiǎn),還是高?最右邊就是核保結(jié)論,給一個(gè)建議。
第二塊提升效率。幫北京地鐵做安檢時(shí)候的一個(gè)案例,也就是說(shuō)過(guò)去安檢檢查違禁物品都是靠人去看的,我們把幾十種這樣的一些違禁物做訓(xùn)練,訓(xùn)練以后機(jī)器把特性提示出來(lái)。效率提高了20%,準(zhǔn)確度達(dá)到了95.5%,提高安檢的速度。大家感覺(jué)過(guò)一個(gè)安檢儀耗時(shí)很長(zhǎng),這樣的技術(shù)手段可以改善感受,右邊有一個(gè)圖可以看到,用了這套技術(shù)以后,在高峰期基本上這個(gè)每小時(shí)通過(guò)可以通過(guò)200個(gè)。
還有一個(gè)提升效率的場(chǎng)景就是幫地鐵站做的人流監(jiān)控。有很多的傳統(tǒng)攝像頭,以往基本上靠人去做,因?yàn)槌鰜?lái)全部是模擬影像數(shù)據(jù)流,都是靠人去去保安室去看,其實(shí)也做不出什么分析的東西。我們做的事情根據(jù)影像信息流用AI模型數(shù)人頭,可以判斷地鐵戰(zhàn)每個(gè)區(qū)域里面的人流密度,根據(jù)這個(gè)人流的密度調(diào)整地鐵站里面不同的通道的開(kāi)關(guān),可以幫地鐵站做疏導(dǎo)分流的決策。
創(chuàng)新這一塊其實(shí)現(xiàn)在來(lái)看會(huì)有一些比較有意思的,比方說(shuō)講藥物做一個(gè)分析,在騰訊做得比較多。大家知道視頻、微信早幾年這些基于AI做小的創(chuàng)新場(chǎng)景的應(yīng)用。
這么多的應(yīng)用其實(shí)落地的時(shí)候遇到一些難題,怎么來(lái)看這些難題,怎么來(lái)解決這些難題?
人工智能應(yīng)用開(kāi)發(fā)與人工智能產(chǎn)業(yè)落地的挑戰(zhàn),我們認(rèn)為主要五個(gè)方面:
第一,應(yīng)用本身。也就是說(shuō)場(chǎng)景越來(lái)越復(fù)雜,以往做一個(gè)應(yīng)用可能只設(shè)計(jì)一個(gè)AI模型就夠了,越往后AI模型串接會(huì)越多,有一些涉及到里面一些分支、分杈不同的東西。這樣會(huì)帶來(lái)以往用煙囪式應(yīng)用,這有點(diǎn)像早年的時(shí)候很多大的企業(yè)級(jí)架構(gòu),系統(tǒng)太多,煙囪式數(shù)據(jù)隔離了,系統(tǒng)之間的集成特別復(fù)雜。這個(gè)在未來(lái)AI應(yīng)用越來(lái)越復(fù)雜也會(huì)有這樣的問(wèn)題。
基礎(chǔ)設(shè)施的問(wèn)題。大家知道做AI的應(yīng)用,不管是訓(xùn)練,其實(shí)對(duì)計(jì)算資源的要求非常高,比方說(shuō)現(xiàn)在最近這幾個(gè)月比較火的NRP模型,這個(gè)模型覺(jué)得很好用,可以很快訓(xùn)練出一個(gè)理解的模型,效果也很好。
這個(gè)模型訓(xùn)練一下GPO成本都是好幾十萬(wàn)美元,一般人肯定用不了。怎么樣把這個(gè)成本訓(xùn)練成普通人可用的架構(gòu),這其實(shí)是需要考慮的一個(gè)問(wèn)題。
數(shù)據(jù)的問(wèn)題,在這邊其實(shí)看到幾個(gè)方面:AI模型對(duì)于數(shù)據(jù)的量和數(shù)據(jù)的質(zhì)量都是很高的要求。
第二,你在訓(xùn)練模型訓(xùn)練好的以后,使用的時(shí)候有很多模型應(yīng)用是包含了不同的AI模型,必然就會(huì)導(dǎo)致再使用這個(gè)應(yīng)用的時(shí)候?qū)@些不同的數(shù)據(jù)源就會(huì)存在很大一塊應(yīng)用開(kāi)發(fā)的量,對(duì)于概念里面去做AI都是模型訓(xùn)練,數(shù)據(jù)科學(xué)家這種專(zhuān)門(mén)去研究算法,他們對(duì)于工程這一塊東西不是特別擅長(zhǎng),這一塊會(huì)出現(xiàn)提供AI的模型人,不知道怎么去關(guān)心怎么去數(shù)據(jù)集成進(jìn)來(lái)。
應(yīng)用這個(gè)模型的人就是客戶,他會(huì)覺(jué)得做這一塊的事情成本很高,很費(fèi)勁。而且這一塊的事情跟業(yè)務(wù)的關(guān)聯(lián)不大,業(yè)務(wù)價(jià)值不高。例如,在一家面板廠做面板缺陷檢測(cè),他提了七類(lèi)缺陷,七類(lèi)缺陷對(duì)應(yīng)的每一類(lèi)缺陷可能有不同的品牌的機(jī)臺(tái),這樣的出來(lái)同一個(gè)缺陷表象一樣。也就是說(shuō)對(duì)每一類(lèi)機(jī)臺(tái)缺陷單獨(dú)建模,這樣帶來(lái)要建幾十個(gè)模型,導(dǎo)致標(biāo)注成本上百萬(wàn)。大家的共識(shí)就是得把這一塊的成本下來(lái),解決大量標(biāo)注的問(wèn)題,以及在模型上線后需要不斷的迭代更新,否則效果會(huì)下降的。
迭代更新的時(shí)候如何把數(shù)據(jù)標(biāo)注和迭代這一塊打通,這其實(shí)也是需要考慮的問(wèn)題。另外還有跟設(shè)備有關(guān),因?yàn)楝F(xiàn)在大部分的AI都是會(huì)和圖像、包括音頻有關(guān)系,這個(gè)肯定涉及到圖像的采集、包括OCR。這些都有設(shè)備,不同的設(shè)備其實(shí)標(biāo)準(zhǔn)比較多,如何接這些設(shè)備,是AI應(yīng)用要去考慮的問(wèn)題。
第二塊基礎(chǔ)設(shè)施的問(wèn)題,大部分基礎(chǔ)設(shè)施第一是說(shuō)貴,第二這些異構(gòu)基礎(chǔ)設(shè)施如何托管,也是需要AI應(yīng)用開(kāi)發(fā)者考慮的問(wèn)題。
第三,數(shù)據(jù)。不同的數(shù)據(jù)標(biāo)準(zhǔn)來(lái)自于國(guó)家、行業(yè)、來(lái)自于企業(yè),還有數(shù)據(jù)標(biāo)注的量特別大,以往源源不斷的迭代就需要標(biāo)注。
算法模型調(diào)優(yōu)這一塊,AI人工智能可以幫到我們,但是需要很大的建模的成本,需要很多人AI模型,一個(gè)模型是只能滿足一個(gè)問(wèn)題。問(wèn)題一多需要很多的模型,必然來(lái)大量一個(gè)建模成本的提高,所有廠商定制化建模解決種AI的滿足業(yè)務(wù)需求,其實(shí)都不太現(xiàn)實(shí),因?yàn)槌杀咎吡恕?/p>
業(yè)界認(rèn)為,解決人力的不足和大量這種多樣化、定制化需求,他的途徑其實(shí)有兩套路。自動(dòng)機(jī)器學(xué)習(xí),這個(gè)是可以看到未來(lái)擺脫人力在建模瓶頸一套可選的路。第二條路就是外部的力量,通過(guò)生態(tài)、引入、外部合作方式解決這個(gè)問(wèn)題。眾人拾柴火焰高,其實(shí)這一塊也是可以在做AI應(yīng)用考慮的一個(gè)問(wèn)題。
再往后就是一些技術(shù)的手段,通過(guò)遷移學(xué)習(xí),把以前網(wǎng)絡(luò)算法拿過(guò)來(lái),強(qiáng)化學(xué)習(xí),相當(dāng)于可以去用獎(jiǎng)懲機(jī)制提高模型的效果。
后面就是設(shè)備的問(wèn)題,其實(shí)現(xiàn)在比較火一個(gè)概念就是云邊端協(xié)同,以往模型是放在云端的,那么前端的可能設(shè)備也好,或者是終端采集回來(lái)的數(shù)據(jù)往后臺(tái)丟,要么就是說(shuō)可能有手機(jī)里面已經(jīng)裝了小的AI模型在里面,那么這里面屬于端和云,現(xiàn)在的話最近提出一個(gè)概念,邊緣計(jì)算。
我們會(huì)在邊緣部署一個(gè)AI,它的好處會(huì)比端模型更復(fù)雜,但是它又會(huì)比云上的AI模型計(jì)算時(shí)候更快一點(diǎn),因?yàn)楦N近場(chǎng)景。在這種情況下就會(huì)有大量的設(shè)備需要托管和管理的。
講了一下我們對(duì)AI產(chǎn)業(yè)落地中五個(gè)方面的難點(diǎn),接下來(lái)看一下騰訊云怎么解決這個(gè)問(wèn)題。我們認(rèn)為應(yīng)對(duì)上面五個(gè)挑戰(zhàn),比如說(shuō)應(yīng)用場(chǎng)景,需要對(duì)應(yīng)用去做服務(wù)化的托管,做一些標(biāo)準(zhǔn)化的封裝。
另外,應(yīng)用上面引入一些合作伙伴一起來(lái)做這個(gè)事情,涉及到合作伙伴的管理。接下來(lái)在資源這一層,我們認(rèn)為可以去做一些引入微的服務(wù)架構(gòu),彈性伸縮,包括監(jiān)控容器化這樣的功能。包括對(duì)底層計(jì)算資源的一個(gè)托管,這樣的話其實(shí)用的容器化隔離地層易購(gòu)的資源。
對(duì)于數(shù)據(jù),我們認(rèn)為,其實(shí)異構(gòu)的數(shù)據(jù)介入,還有不同的數(shù)據(jù)標(biāo)準(zhǔn),數(shù)據(jù)標(biāo)注。對(duì)于異構(gòu)數(shù)據(jù)接入,我們的解決辦法市面上羅列出來(lái)的數(shù)據(jù)源的適配全部,做到對(duì)于應(yīng)用開(kāi)發(fā)者而言不用關(guān)心。
對(duì)于數(shù)據(jù)標(biāo)準(zhǔn)的適配也是一樣,我們會(huì)把一些主流標(biāo)準(zhǔn)、一些數(shù)據(jù)需要轉(zhuǎn)化或者是適配的模板做好。數(shù)據(jù)標(biāo)注就兩條腿,對(duì)于不是特別敏感的數(shù)據(jù)可以這么做的。這個(gè)平臺(tái)關(guān)注模型訓(xùn)練好以后應(yīng)用就可以落地。
模型訓(xùn)練完成了以后部署的服務(wù),包括如何去迭代。模型的評(píng)估作為騰訊算是權(quán)威第三方對(duì)不同來(lái)源的做評(píng)估,供應(yīng)用開(kāi)發(fā)者去使用。包括邊緣的推理這也是需要解決的問(wèn)題。
設(shè)備,主要做的幾個(gè)事情,一是設(shè)備的接入、設(shè)備的適配、設(shè)備模型的定義,包括設(shè)備升級(jí)和設(shè)備狀態(tài)監(jiān)控。為了達(dá)到前面講的這樣一些能力,我們推出這樣一款產(chǎn)品,云智天樞平臺(tái)全棧式人工智能服務(wù)平臺(tái),這個(gè)平臺(tái)結(jié)構(gòu)是像B字一樣?;疑牟糠制鋵?shí)就是平臺(tái)本身,上面和下面其實(shí)都是屬于可以插在平臺(tái)上面外部一些能力。下面這一層把騰訊內(nèi)部的AI的能力,包括外部合作的模型能力,包括數(shù)據(jù)、設(shè)備接在這個(gè)平臺(tái)上,上層可以基于原子能力通過(guò)服務(wù)化的調(diào)用和拼裝做應(yīng)用。這個(gè)平臺(tái)主要會(huì)分成包含六個(gè)窗口,底層三個(gè)窗口算法倉(cāng)庫(kù)、設(shè)備中心、數(shù)據(jù)中心,分別管理托管算法原子能力,設(shè)備原子能力的數(shù)據(jù)原子能力。AI工作室把底層這些原子能力通過(guò)一些工作流的調(diào)度傳接形成比較復(fù)雜的場(chǎng)景。
應(yīng)用中心對(duì)這個(gè)封裝好的工作流做應(yīng)用,應(yīng)用可以在托管。管理一些基礎(chǔ)平臺(tái)管理的功能。
這一塊講平臺(tái)可以什么樣的方式來(lái)使用?我們這邊總結(jié)了有三種模式。
第一種模式AI中臺(tái)方式,作為一個(gè)企業(yè)級(jí)的AI中臺(tái)。
第二,某個(gè)客戶對(duì)某個(gè)應(yīng)用場(chǎng)景有需求。
第三,有些AI應(yīng)用廠商技術(shù)比較牛,它可能需要騰訊云提供拿到AI原子能力就可以,比如說(shuō)人臉識(shí)別、語(yǔ)音、語(yǔ)意,這種情況以這種平臺(tái)作為模型托管的容器提供能力。
這邊是平臺(tái)的特性,我們認(rèn)為有四個(gè)特性可以單獨(dú)講一講。
第一自動(dòng)化的算法接入,我們這邊算法接入只需要點(diǎn)幾個(gè)按鈕就可以了。第二,全棧式的服務(wù),從模型部署到模型的服務(wù)推理上線,反饋數(shù)據(jù)的采集、標(biāo)注,模型的迭代包括設(shè)備的介入整個(gè)是打通的。第三,靈活定制。AI的工作室原子能力進(jìn)行編排和調(diào)度的時(shí)候,其實(shí)需要少量的代碼。通過(guò)可視化、選擇配置就可以把一個(gè)工作流給配出來(lái)了。第四,對(duì)于云邊端混合部署和服務(wù)調(diào)度,包括數(shù)據(jù)終端的模型怎么推到邊緣,邊緣的狀態(tài)怎么回到云端等等這樣一些功能,我們都是支持。這是我們認(rèn)為平臺(tái)的幾個(gè)特點(diǎn)。
對(duì)于平臺(tái)而言戶,其實(shí)不只是說(shuō)企業(yè)級(jí)客戶,我們最早目標(biāo)用戶客戶開(kāi)發(fā)者,價(jià)值在于幫助開(kāi)發(fā)者快速去構(gòu)建應(yīng)用,可以建模而言人分享自己的,獲得自己的收入。
以上就是我今天分享的內(nèi)容。謝謝大家!