英特爾高級(jí)首席工程師、大數(shù)據(jù)分析和人工智能創(chuàng)新院院長(zhǎng)戴金權(quán)


9月19日,數(shù)交會(huì)首屆全球數(shù)字經(jīng)濟(jì)大會(huì)在大連隆重召開(kāi),英特爾高級(jí)首席工程師、大數(shù)據(jù)分析和人工智能創(chuàng)新院院長(zhǎng)戴金權(quán)發(fā)表主旨演講。以下為演講摘錄(未經(jīng)本人審定)。

我們已經(jīng)進(jìn)入大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)顯示50%的數(shù)據(jù)是近兩年產(chǎn)生的,而不到2%的數(shù)據(jù)得到了真正的分析,大數(shù)據(jù)分析、人工智能在實(shí)際生產(chǎn)環(huán)境應(yīng)用中還面臨著非常多的挑戰(zhàn)。

谷歌2015年發(fā)表的一篇論文很好闡述了這個(gè)問(wèn)題。最中間有一個(gè)小黑框,是機(jī)器學(xué)習(xí)、深度學(xué)習(xí)或者人工智能的模型算法。今天我們?cè)趯?shí)驗(yàn)室里構(gòu)建一個(gè)新的模型,或者在開(kāi)源社區(qū)下載一個(gè)模型不是太困難,但是將構(gòu)建出的模型很好應(yīng)用到現(xiàn)實(shí)的工業(yè)級(jí)生產(chǎn)環(huán)境中,事實(shí)上有非常多的事情要做。這也是為什么英特爾致力于將人工智能和大數(shù)據(jù)分析處理的底層架構(gòu)結(jié)合在一起。

BIGDL是我們2017年開(kāi)源的一個(gè)項(xiàng)目,它是第一個(gè)在大數(shù)據(jù)平臺(tái)上構(gòu)建的分布式深度學(xué)習(xí)框架,目的是幫助用戶在現(xiàn)有大數(shù)據(jù)平臺(tái)上構(gòu)建新的人工智能深度學(xué)習(xí)。人工智能社區(qū)有各種各樣的技術(shù)和深度學(xué)習(xí)框架,同時(shí)大數(shù)據(jù)平臺(tái)也是一個(gè)非?;钴S的生態(tài)架構(gòu),如何將不同大數(shù)據(jù)處理分析或者人工智能技術(shù)有機(jī)整合在一起構(gòu)成一個(gè)端到端的流水線,來(lái)解決用戶的問(wèn)題呢?事實(shí)上,這是應(yīng)用落地的最大瓶頸。去年我們開(kāi)源了ANALYTCSZOO大數(shù)據(jù)分析人工智能平臺(tái),幫助用戶在現(xiàn)有大數(shù)據(jù)平臺(tái)上,把各種AI技術(shù)統(tǒng)一到統(tǒng)一平臺(tái)中。

數(shù)據(jù)科學(xué)家通常先構(gòu)建一個(gè)原形,再進(jìn)行各種優(yōu)化提高準(zhǔn)確度,然后將數(shù)據(jù)搬到生產(chǎn)環(huán)境中,這不是一個(gè)高效的過(guò)程,我們希望通過(guò)ANALYTCSZOO更方便地為客戶構(gòu)建原形,直接訪問(wèn)數(shù)據(jù),無(wú)縫擴(kuò)展到生產(chǎn)環(huán)境中,而不需要任何代碼修改或數(shù)據(jù)拷貝。

將人工智能技術(shù)方便無(wú)縫地應(yīng)用在大規(guī)模分布式大數(shù)據(jù)分析平臺(tái)上是一個(gè)重要的技術(shù)創(chuàng)新,下面看看我們是如何與合作伙伴、用戶一起來(lái)做這件事情的。

我們和微軟云團(tuán)隊(duì)合作,他們的訴求是希望給用戶提供更高效的客服系統(tǒng),用戶甚至可以通過(guò)微信公眾號(hào)的界面,找到最對(duì)應(yīng)的回答反饋。問(wèn)題和回答做匹配,不僅通過(guò)關(guān)鍵字,也可以通過(guò)自然語(yǔ)言進(jìn)行匹配。如果用戶得到的回答不能解決問(wèn)題,再轉(zhuǎn)到人工服務(wù)。這一過(guò)程中我們通過(guò)文本分類自然云處理一些模型,嵌入到端到端流水線中,讓人工智能更好地應(yīng)用于客服系統(tǒng)中。

美的是一家大型工業(yè)機(jī)器人制造商,有非常多的產(chǎn)品需要進(jìn)行檢測(cè)。他們希望通過(guò)人工智能技術(shù)、計(jì)算機(jī)識(shí)別等進(jìn)行自動(dòng)檢測(cè)??峥C(jī)器人接上一個(gè)攝像機(jī),對(duì)流水線上的產(chǎn)品進(jìn)行拍照,然后直接進(jìn)行物體識(shí)別。整個(gè)過(guò)程需要完整的端到端服務(wù),首先在云端要進(jìn)行大規(guī)模訓(xùn)練和判斷,同時(shí)在邊緣端進(jìn)行推理、實(shí)時(shí)識(shí)別。我們的合作得到了滿意的模型,基于英特爾酷睿進(jìn)行推理判斷。

CERN是歐洲原子能機(jī)構(gòu),運(yùn)營(yíng)粒子對(duì)撞機(jī),每秒產(chǎn)生1PB的數(shù)據(jù)因?yàn)闊o(wú)法存儲(chǔ)都會(huì)直接扔掉,訴求是希望將其中有用的數(shù)據(jù)留下來(lái)進(jìn)行數(shù)據(jù)分析。關(guān)鍵是如何構(gòu)建一個(gè)過(guò)濾系統(tǒng),將每秒對(duì)撞產(chǎn)生的1PB數(shù)據(jù)過(guò)濾后只剩下10GB非常有用的數(shù)據(jù)。我們和CERN合作,構(gòu)建了一個(gè)端到端數(shù)據(jù)處理分析和深度學(xué)習(xí)流水線,運(yùn)用大數(shù)據(jù)系統(tǒng)進(jìn)行實(shí)時(shí)的流處理,從而將有用的研究數(shù)據(jù)保留下來(lái)。

當(dāng)人們希望把人工智能、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)的算法應(yīng)用到現(xiàn)實(shí)生產(chǎn)環(huán)境中,會(huì)涉及如何進(jìn)行大規(guī)模數(shù)據(jù)處理分析等各種問(wèn)題,這是英特爾希望做的事情,也希望跟合作伙伴共同創(chuàng)新,更好地推動(dòng)大數(shù)據(jù)分析和人工智能在實(shí)際生產(chǎn)中的落地,更好地對(duì)生產(chǎn)、生活進(jìn)行改善。

分享到

xiesc

相關(guān)推薦