英特爾中國(guó)區(qū)非易失性存儲(chǔ)事業(yè)部總經(jīng)理劉鋼

劉鋼:各位嘉賓,各位朋友,下午好。很高興能有機(jī)會(huì)在年底到中國(guó)數(shù)字經(jīng)濟(jì)峰會(huì)跟各位分享交流,感謝DOIT的邀請(qǐng)。

人工智能在過(guò)去一年進(jìn)展非常快,其實(shí)不僅是平臺(tái)的改善和發(fā)展,而且在各種應(yīng)用上已經(jīng)進(jìn)步的非??欤搅宋覀兩畹暮芏喾矫?,剛剛提到的城市管理,阿里的智慧大腦和百度提到的智能媒體還有智能的醫(yī)療,還有科大訊飛,其實(shí)在我自己生活中,我每天也可以感受到人工智能,今天早上我從上海飛過(guò)來(lái),我在樓上聽到我兒子在樓下說(shuō)話,他說(shuō)丁東給我講故事,前不久我剛買了人工智音響,最近我發(fā)現(xiàn)我太太學(xué)英語(yǔ)比較專心,老是拿手機(jī)說(shuō)話,因?yàn)槭謾C(jī)可以自動(dòng)的給她判別發(fā)言是否標(biāo)準(zhǔn),我覺得打分比較合理,在我們家,我女兒得分是最高的,我覺得人工智能已經(jīng)進(jìn)展到跟我們的生活緊密相關(guān)。

為什么在過(guò)去的一年兩年中,人工智能發(fā)展的這么快,跟以前的人工智能有什么不同?上一次大的浪潮是在97年,整整二十年,過(guò)去二十年為什么人工智能到現(xiàn)在發(fā)展這么快?那個(gè)時(shí)候的人工智能跟現(xiàn)在不一樣,那個(gè)時(shí)候的人工智能學(xué)習(xí)方法是推理,人知道怎么解決問(wèn)題,只是要給它數(shù)據(jù)推斷出來(lái)怎么解決問(wèn)題,而今天的人工智能是很多問(wèn)題人根本就不知道怎么解答,甚至人的解答能力還不如機(jī)器,機(jī)器通過(guò)大規(guī)模的深度學(xué)習(xí),自己找到解決問(wèn)題的方法,這是通過(guò)深度學(xué)習(xí)找到的解決方法。后一種方法,可以讓機(jī)器做得比人更好,甚至有很多時(shí)候擺脫了人的曲線,比如說(shuō)像阿爾法狗,甚至都沒有輸入大量的數(shù)據(jù),就讓兩臺(tái)機(jī)器左右的互補(bǔ)學(xué)習(xí),說(shuō)話人工智能已經(jīng)進(jìn)展到了新的階段,這個(gè)新的階段主要是有四方面的技術(shù)的快速發(fā)展,讓新的學(xué)習(xí)能力得以實(shí)現(xiàn)。

第一,大數(shù)據(jù)的快速存取。第二,高性能的計(jì)算能力,大家知道今天的阿爾法狗是二十年前深藍(lán)計(jì)算能力的三萬(wàn)倍。第三,非常多新的算法的出現(xiàn),而且算法通過(guò)互聯(lián)網(wǎng)平臺(tái)共享,算法的迭代升級(jí)也非??臁5谒?,跟剛剛科大訊飛講到的也很一致,人不僅是有數(shù)據(jù),在機(jī)器計(jì)算機(jī)里面的數(shù)據(jù)進(jìn)行學(xué)習(xí),而是有大量的物聯(lián)網(wǎng)的設(shè)備部署,有大量的傳感器,能夠感知真實(shí)的世界,能夠看得見,可以感受得到真實(shí)世界,由此采集了很多的數(shù)據(jù),這個(gè)大量的數(shù)據(jù)又變成下一步機(jī)器學(xué)習(xí)的來(lái)源,所以這個(gè)是大部分大數(shù)據(jù)高性能計(jì)算和更高效算法以及大規(guī)模布置的物聯(lián)網(wǎng)的傳感器,讓人工智能發(fā)展到今天這波,跟以前完全是基于邏輯推理的人工智能有非常大的不一樣。

講到四大關(guān)鍵技術(shù)推動(dòng)人工智能發(fā)展,今天我想特別講到其中的一塊,因?yàn)槎几鷶?shù)據(jù)有關(guān)系,我想特別強(qiáng)調(diào)數(shù)據(jù)技術(shù)的進(jìn)展,另一方面,也是英特爾我們自己把數(shù)據(jù)看得非常重要,以至于我們的CEO現(xiàn)在對(duì)外講英特爾是一家什么樣的公司時(shí)候,他絕對(duì)說(shuō)我們是一家新銳公司,很多數(shù)據(jù)技術(shù)在英特爾越來(lái)越投入,進(jìn)展越來(lái)越快,data在我們公司變得非常重要,也許這次我們看的是CIO論壇,沒準(zhǔn)下次我們看的是CDO論壇,今年年初大家看到可口可樂(lè)取消了CMO,有了CGO,數(shù)據(jù)就是下一個(gè)能源。

在數(shù)據(jù)方面有哪些進(jìn)展?有哪些新的技術(shù)可以幫助我們更有效的存和取大規(guī)模的數(shù)據(jù),來(lái)支持新一代的人工智能?

我們首先來(lái)看大數(shù)據(jù)的分層,大家都在說(shuō)大分局,人產(chǎn)生的數(shù)據(jù)和機(jī)器產(chǎn)生的數(shù)據(jù),以及工廠產(chǎn)生的數(shù)據(jù),完全是不同數(shù)量級(jí)的,這是每一天這些設(shè)備產(chǎn)生的數(shù)據(jù),設(shè)備產(chǎn)生的數(shù)據(jù)遠(yuǎn)遠(yuǎn)超過(guò)人,但是這個(gè)數(shù)據(jù)量大,并不是重要的,最重要的是這些大量的數(shù)據(jù)需要得到及時(shí)的處理,能夠更靠近處理它的處理器,無(wú)論這個(gè)處理器是CPU還是CPU還是神經(jīng)原芯片,可以更高效的處理人工智能。

但是另一方面,又不可能把大量的數(shù)據(jù)全部放到CTO,因?yàn)槟阕霾坏?,我們可以看到,根?jù)應(yīng)用的不同,應(yīng)用場(chǎng)景的不同,和數(shù)據(jù)重要性不行,把數(shù)據(jù)分成三大類,第一大類大家很熟悉了,冷數(shù)據(jù),第二部分是溫?cái)?shù)據(jù),第三個(gè)是熱數(shù)據(jù),需要實(shí)時(shí)在線,這三種不同層的數(shù)據(jù)需要用不同的存儲(chǔ)技術(shù)解決,下面我很快給大家看一下在未來(lái)這幾個(gè)主要的存儲(chǔ)技術(shù)的發(fā)展,今天吃午飯的時(shí)候我們還聊到未來(lái)幾個(gè)產(chǎn)品大的種類,大家可以看到,在未來(lái)的三到四年中,硬盤的市場(chǎng)占有量是在逐漸萎縮的,中間增長(zhǎng)最快的是HC,從今天的市場(chǎng)到2020年變成300億市場(chǎng),而且SSD部分產(chǎn)品不僅是向下代替了很多快速硬盤的市場(chǎng),而且向上也代替了很多內(nèi)存的市場(chǎng),為什么這樣?這是因?yàn)橛行碌拇鎯?chǔ)技術(shù)出現(xiàn)。

在講新的存儲(chǔ)技術(shù)之前,我想給各位看一個(gè)圖,存儲(chǔ)在各位CIO的預(yù)算或者花費(fèi)中占比有多少,這是一個(gè)全球的數(shù)據(jù)。大概在基礎(chǔ)架構(gòu)的花費(fèi)中,你可以看到,在存儲(chǔ)部分的花費(fèi)會(huì)占到20%,不包括內(nèi)存;加上內(nèi)存,大概會(huì)占到整個(gè)IT基礎(chǔ)架構(gòu)花費(fèi)的40%以上。上周末我在蘇州參加行業(yè)年度峰會(huì),跟好幾位互聯(lián)網(wǎng)的服務(wù)商在交流,馬上就有很大的互聯(lián)網(wǎng)公司的IT高管跟我說(shuō),其實(shí)那個(gè)費(fèi)用已經(jīng)超過(guò)50%了,存儲(chǔ)的花費(fèi)已經(jīng)超過(guò)了IT花費(fèi)的50%以上了,尤其是隨著最新內(nèi)存的漲價(jià),而且不止內(nèi)存漲價(jià),新的人工智能也需要更多的內(nèi)存兩個(gè)因素結(jié)合到一起,可以看到,在存儲(chǔ)和內(nèi)存上的花費(fèi)非常大,在過(guò)去兩年這兩個(gè)加起來(lái)占到720億美金。中國(guó)市場(chǎng)綠色的部分是固態(tài)盤,企業(yè)級(jí)固態(tài)盤占整個(gè)市場(chǎng)今天的三分之一,但是2020年企業(yè)固態(tài)盤占整個(gè)固態(tài)盤市場(chǎng)一半,在全球市場(chǎng)企業(yè)級(jí)固態(tài)盤今天就占到所有固態(tài)盤的一半以上,企業(yè)在它的IT基礎(chǔ)架構(gòu)里,大規(guī)模的部署新的存儲(chǔ)技術(shù),但是這種全新的存儲(chǔ)技術(shù)用在溫?cái)?shù)據(jù)上,就是現(xiàn)有的固態(tài)盤數(shù)據(jù),因?yàn)闇財(cái)?shù)據(jù)既要求高密度,也要求大容量,而且還要比硬盤更快,這個(gè)部分基于閃存技術(shù)的固態(tài)盤可以滿足要求,這一部分還有新的發(fā)展,大家可以看到,新的發(fā)展一方面是在接口方面,2017年開始,2018年會(huì)有非常大的轉(zhuǎn)變,2017年轉(zhuǎn)變已經(jīng)開始了,固態(tài)盤的接口大規(guī)模的轉(zhuǎn),今天像BAT公司50%以上的固態(tài)盤已經(jīng)轉(zhuǎn)向了PCIE,因?yàn)楣虘B(tài)盤如果還用傳統(tǒng)的接口,接口本身就是瓶頸,所以在固態(tài)盤的基礎(chǔ)上,往下非常大的轉(zhuǎn)變其中之一就是存儲(chǔ)接口的改變,這個(gè)跟英特爾最新的計(jì)算平臺(tái)也有關(guān)系,在一臺(tái)服務(wù)器里面部署幾十片的PCIE的盤,各位可以看看今天外面的展臺(tái)已經(jīng)有好幾家廠商的產(chǎn)品,就是在一臺(tái)服務(wù)器上,這是一個(gè)發(fā)展趨勢(shì)。

還有一個(gè)發(fā)展趨勢(shì),固態(tài)盤不僅是快,以前我們認(rèn)為固態(tài)盤的劣勢(shì),硬盤的存儲(chǔ)密度更高,固態(tài)盤只有幾百GB,但是現(xiàn)在不一樣了,固態(tài)盤的存儲(chǔ)密度甚至可能更高,今天如果沒有實(shí)現(xiàn)一個(gè)PB的存儲(chǔ)容量,用硬盤技術(shù)做,2TB可能要放滿42u機(jī)架,裝滿服務(wù)器,每一臺(tái)服務(wù)器插滿2TB硬盤,可以做到一個(gè)PB,有些公司已經(jīng)開始測(cè)試了,新型的固態(tài)盤高密度的會(huì)變成1U服務(wù)器,1PB,整整一個(gè)機(jī)柜變成1U服務(wù)器,這是產(chǎn)品在測(cè)試當(dāng)中,是基于3D64層,在一條寸子大的固態(tài)盤里,可以達(dá)到存儲(chǔ)容量32TB,在一臺(tái)服務(wù)器放滿32個(gè),就是一個(gè)PB,可以讓溫?cái)?shù)據(jù)完全用基于新型的閃存固態(tài)盤實(shí)現(xiàn),所以基于閃存NAND顆粒的可以很好的解決溫?cái)?shù)據(jù)部分。

我們?cè)倏磾?shù)據(jù)分層,現(xiàn)在熱數(shù)據(jù)部分還是用DRAM實(shí)現(xiàn),新的應(yīng)用對(duì)DRAM需求越來(lái)越大,尤其是人工智能,需要大量的樣本比對(duì),機(jī)器學(xué)習(xí)也需要大內(nèi)存,越來(lái)越多的應(yīng)用都需要內(nèi)存,而內(nèi)存價(jià)格飛漲,內(nèi)存的容量其實(shí)過(guò)去幾年并沒有太大的增長(zhǎng),大家可以看這個(gè)圖,左邊這個(gè)圖是過(guò)去幾年內(nèi)存的增長(zhǎng),你可以看到內(nèi)存顆粒的增長(zhǎng),容量增長(zhǎng)越變?cè)铰?,所以類似的容量并沒有快速增長(zhǎng),而另一方面,閃存又太慢,因?yàn)殚W存跟內(nèi)存比太慢了,是從時(shí)延上來(lái)講,人工智能里時(shí)延非常重要,人工智能的應(yīng)用對(duì)時(shí)延要求非常高,要在每一個(gè)部分降低時(shí)延,但是你看在nand里面和dram時(shí)延差一千倍,兩個(gè)之間有很大的鴻溝,一方面DRAM進(jìn)展太慢,另外NAND基于閃存的SSD太大了,如果我用這個(gè)圖比較大家可以更清楚的了解,CPU里面的存儲(chǔ)叫SRAM,這個(gè)作為數(shù)量級(jí)1比對(duì),大家可以看到,DRAM延遲大概是10,lateney是10萬(wàn),硬盤就是一千萬(wàn),是更慢的,怎么樣能夠彌補(bǔ)這兩個(gè)之間的無(wú)論是性能還是價(jià)格,還是時(shí)延上的巨大差距呢?一種新的材質(zhì)會(huì)出現(xiàn),就是英特爾的新型材質(zhì),3DXPoint,Latency只有100,跟內(nèi)存比沒有差太多,但是密度卻大很多,這種新的存儲(chǔ)介質(zhì)介于DRAM和NAND之間,今天中午討論到了英特爾現(xiàn)在有基于PCIE的接口,聽說(shuō)未來(lái)也會(huì)有基于DRAM的接口,因?yàn)樗炝?,只用PCIE無(wú)法把性能完全發(fā)揮出來(lái),明年我們會(huì)看到有DRAM的接口出來(lái)。

我們先看看基于PCIE接口的產(chǎn)品,有什么樣的性能提升,簡(jiǎn)單的來(lái)說(shuō),無(wú)論在Qos9的時(shí)候是60X,時(shí)延是最難提升的,從各個(gè)方面來(lái)講,而ot low產(chǎn)品第一代時(shí)延就相當(dāng)于現(xiàn)在最快的四十分之一,提高了40倍,在時(shí)延加速上,所以可以看到,它最大的優(yōu)勢(shì)就是在時(shí)延的改進(jìn)方面,這是40倍的提升,是完全革命性的新的存儲(chǔ)技術(shù)。

這種新的存儲(chǔ)技術(shù)有多種的應(yīng)用場(chǎng)景,常常也會(huì)問(wèn)到你們這么快的產(chǎn)品怎么定位的,兩種定位,第一種定位是最快的SSD,所以這里面有一個(gè)大數(shù)據(jù)庫(kù),各位如果有非常大型的數(shù)據(jù)庫(kù),當(dāng)運(yùn)行到optoneSSD上,每秒處理能力從原來(lái)的1365變成了13650,提高了十倍,只是把盤從nandSSD變成了optoneSSD,就是當(dāng)成最快的SSD,得到的好處不僅是每秒鐘TBS倍數(shù)增長(zhǎng),同時(shí)時(shí)延比原來(lái)改進(jìn)了五倍。在前不久阿里的云棲大會(huì),阿里也是應(yīng)用這個(gè)進(jìn)展,因?yàn)榘⒗镉蟹浅?qiáng)的反應(yīng)能力,因?yàn)榇蠹抑腊⒗镫p十一的交易量非常大,所以阿里的數(shù)據(jù)庫(kù)開發(fā)非常領(lǐng)先,阿里的最新數(shù)據(jù)庫(kù)比MySQL還快,所以這是當(dāng)成一個(gè)更快的或者最快的固態(tài)盤。

另一種應(yīng)用方法,是把它當(dāng)成更大的內(nèi)存,因?yàn)樗鷥?nèi)存的速度相比,也只有一個(gè)數(shù)量級(jí)的差別,不是太大的差別,當(dāng)成一個(gè)更大的內(nèi)存,所以當(dāng)你的內(nèi)存平時(shí)只有幾個(gè)GB,而你需要幾個(gè)TB內(nèi)存做人工智能的時(shí)候,Optone是個(gè)不錯(cuò)的選擇。我們來(lái)看一個(gè)例子,這個(gè)公司原來(lái)只有很小的內(nèi)存,用了Optone以后有了很大的提升。

(播放視頻)

剛剛大家看到的應(yīng)用,是把Optone當(dāng)成一個(gè)擴(kuò)展的新型更大內(nèi)存實(shí)現(xiàn),這個(gè)圖大家可以看到,原本你左邊插滿了內(nèi)存條,新的配置只需要一個(gè)內(nèi)存條,就是Optone,做到只有原來(lái)成本的三分之一,但是可以達(dá)到1.9,可以看到新型的材料新型的存儲(chǔ)介質(zhì)來(lái)適應(yīng)大數(shù)據(jù)的需求,因?yàn)榇髷?shù)據(jù)的發(fā)展才剛剛開始,未來(lái)會(huì)有更大規(guī)模的數(shù)據(jù),這個(gè)時(shí)候只是依賴傳統(tǒng)的DRAM發(fā)展不足以滿足人工智能發(fā)展的需求,尤其是這一波人工智能是大數(shù)據(jù)推動(dòng)的,所以后面支持大數(shù)據(jù)的數(shù)據(jù)技術(shù)創(chuàng)新就顯得尤其重要,不僅是計(jì)算能力創(chuàng)新,而且是數(shù)據(jù)技術(shù)創(chuàng)新非常重要,所以英特爾不計(jì)算自己是一個(gè)計(jì)算公司,而說(shuō)自己是一個(gè)數(shù)據(jù)公司。

剛才講的還是通過(guò)大內(nèi)存來(lái)解決已經(jīng)知道的問(wèn)題,現(xiàn)在這個(gè)應(yīng)用是什么?就是內(nèi)存大到了不是貴的問(wèn)題,是原來(lái)不可能做到這么大的內(nèi)存的,誰(shuí)試過(guò)讓服務(wù)器達(dá)到24個(gè)TB,或者48個(gè)TB的,沒有做到過(guò),但是如果有Optone就可以做到,當(dāng)你應(yīng)用在上層的時(shí)候,讓根本原來(lái)無(wú)法解決的問(wèn)題變得可以解決,這個(gè)也是Optone基于新型的存儲(chǔ)介質(zhì)的SSD產(chǎn)品帶來(lái)的優(yōu)勢(shì),尤其是對(duì)人工智能會(huì)帶來(lái)非常多的幫助,尤其是這部分帶來(lái)不僅是容量的變大,關(guān)鍵是延遲時(shí)間,在這個(gè)方面我們跟訊飛也有一個(gè)討論,剛剛部署的AI的云平臺(tái),在那個(gè)部分,為了縮短人工智能、云對(duì)應(yīng)用響應(yīng)的延遲時(shí)間,它幾乎在每一個(gè)部分去減少時(shí)延,所以O(shè)ptone是其中非常重要的一個(gè)技術(shù)。這是訊飛照片,可以看到他的人工智能平臺(tái),可以看到實(shí)際上Optone在今年已經(jīng)在很多人工智能平臺(tái)中開始使用了。

我們希望能夠擴(kuò)大我們新型的存儲(chǔ)技術(shù)對(duì)大數(shù)據(jù)和人工智能的應(yīng)用,也希望跟各位一起合作,因?yàn)榇髷?shù)據(jù)是支撐我們?nèi)斯ぶ悄馨l(fā)展的最關(guān)鍵的一個(gè)技術(shù),所以英特爾的部門叫NSG,這個(gè)名字是非易失性存儲(chǔ)解決方案事業(yè)部,謝謝大家。

 

分享到

xiesc

相關(guān)推薦