以下內(nèi)容根據(jù)速記整理,未經(jīng)本人審定。

聽眾朋友大家好,我今天講的題目是“存儲(chǔ)技術(shù)發(fā)展的驅(qū)動(dòng)力及生態(tài)系統(tǒng)”。

數(shù)字化的哲學(xué)奠基與科學(xué)奠基

首先我們從峰會(huì)的兩個(gè)關(guān)鍵詞講起,一個(gè)是數(shù)據(jù),一個(gè)是存儲(chǔ)。講到數(shù)據(jù)我們首先看到6000年前伏羲提出了八卦圖,一長(zhǎng)橫代表一,兩短橫代表零,所以上面一一就是代表天,下面零零代表地,這就是數(shù)字化的思想原點(diǎn)。

老子說“一生二,二生三,三生萬物。”這就實(shí)際上表達(dá)了數(shù)字可以表達(dá)萬物的思想。在2500年前的希臘數(shù)學(xué)家、哲學(xué)家畢達(dá)哥拉斯說“萬物皆數(shù)”,也就是說宇宙的一切規(guī)律皆可以由數(shù)來表達(dá),大家記住這個(gè)結(jié)論,就是萬物皆數(shù),這就是數(shù)字化的哲學(xué)奠基。

2000多年過去了,我們的信息表達(dá)都還不是數(shù)字化,比如文字、聲音、電影、照相、電視、攝像這都不是數(shù)字化,我們還要等待幾位偉人的到來,這就是奠定了我們數(shù)字化科學(xué)基礎(chǔ)的四位大師,一個(gè)是萊布尼茨的二進(jìn)制,一個(gè)是喬治·布爾的布爾代數(shù),再就是香農(nóng)的信息論還有開關(guān)電路理論以及圖靈的圖靈機(jī)。

這個(gè)圖靈機(jī)是一個(gè)理論能力極強(qiáng)的智能模型,他本來是為回答一個(gè)希爾伯特的世紀(jì)之問而提出的,希爾伯特在1900年世界數(shù)學(xué)家大會(huì)上提了一個(gè)問題,他說:“存不存在解決所有數(shù)學(xué)問題的一般算法?”,1936年圖靈發(fā)表了劃時(shí)代的論文,構(gòu)建了一個(gè)圖靈機(jī),就是一個(gè)無限長(zhǎng)的帶子在一個(gè)紙簍上對(duì)帶子進(jìn)行讀和寫,在有限的規(guī)則上把零變成一,一變成零,這個(gè)圖靈機(jī)就代表著一種智能自動(dòng)化的實(shí)現(xiàn)手段就是計(jì)算,就是在有限的規(guī)則下對(duì)數(shù)據(jù)進(jìn)行序列變換,就是這個(gè)可以解決一切數(shù)學(xué)問題,所以這個(gè)能力非常強(qiáng)大。

圖靈機(jī)實(shí)際上分為三個(gè)部分,第一個(gè)就是處理部分——對(duì)讀寫頭進(jìn)行控制,第二就是存儲(chǔ)部分就是那個(gè)無限長(zhǎng)的帶子,第三個(gè)就是傳出部分是帶子的移動(dòng),這個(gè)模型實(shí)際上能力特別強(qiáng)大,已經(jīng)超出圖靈的想象,圖靈說“他可以解決一切數(shù)學(xué)問題!”但是實(shí)際上他是可以解決更多的問題。

元胞自動(dòng)機(jī)領(lǐng)域的一位大師Stephen Wolfram寫了一本書叫《一種新科學(xué)》,里面說“300年來,科學(xué)建立在數(shù)學(xué)的基礎(chǔ)上,而今后的科學(xué)將建立在計(jì)算機(jī)程序的基礎(chǔ)上,計(jì)算機(jī)程序也就是計(jì)算,可以表達(dá)宇宙的一切規(guī)律!”

他構(gòu)造了這樣一個(gè)元胞自動(dòng)機(jī),簡(jiǎn)單的規(guī)則可以產(chǎn)生復(fù)雜的現(xiàn)象,而且我們可以從這個(gè)上理解我們的DNA上有人的這個(gè)簡(jiǎn)單規(guī)則,但是按照順序生長(zhǎng)下去,他就會(huì)把一個(gè)受精卵逐漸變成一個(gè)完整的人,而且從年輕到老去都可以用計(jì)算機(jī)模擬出來,這就是我們的數(shù)字生命。

其結(jié)論是計(jì)算程序也就是計(jì)算可以表達(dá)世間的一切規(guī)律!所以Wolfram是從元胞自動(dòng)機(jī)得出了這個(gè)結(jié)論,但他的同事證明“元胞自動(dòng)機(jī)和圖靈機(jī)是等效的!”所以圖靈機(jī)的理論能力極強(qiáng)叫表達(dá)世間一切規(guī)律!這個(gè)科學(xué)得到的結(jié)論和哲學(xué)得到的是一樣的,就是萬物皆數(shù)!宇宙的一切規(guī)律皆可以有數(shù)來表達(dá),這就是科學(xué)給數(shù)字化定下的一個(gè)遙遠(yuǎn)的終點(diǎn),我們現(xiàn)在還在路上。

數(shù)字時(shí)代開始,我們目前才走了四步

從圖靈機(jī)開始,數(shù)字時(shí)代真正開始,我們目前才走了四步,而其重點(diǎn)是可以表達(dá)宇宙的一切規(guī)律,那還遠(yuǎn)的很,所以存儲(chǔ)的第一個(gè)驅(qū)動(dòng)力就是數(shù)字化進(jìn)程步伐的加快,那么數(shù)字化1.0我稱其為多媒體驅(qū)動(dòng)的,就是我們敲命令行到可以表達(dá)圖像、圖片、視頻就是信息形式多媒體化;

數(shù)字化2.0是互聯(lián)網(wǎng)推動(dòng)的,那么有無線和有線互聯(lián)網(wǎng),我們把社交這種關(guān)系通過網(wǎng)絡(luò)數(shù)字化我們就有微信,我們把商品交易通過網(wǎng)絡(luò)數(shù)字化就有了淘寶,這樣信息大量流動(dòng)產(chǎn)生大量的數(shù)據(jù),這是第二個(gè)數(shù)據(jù)爆發(fā)點(diǎn);

數(shù)字化3.0是由是由物聯(lián)網(wǎng)推動(dòng)的,他的特征是由人產(chǎn)生數(shù)據(jù)到物產(chǎn)生數(shù)據(jù),那物比人多得多是不是,這樣數(shù)據(jù)量又會(huì)大爆發(fā),這是第三個(gè)爆發(fā)點(diǎn);

數(shù)字化4.0就是現(xiàn)在特別熱的元宇宙,元宇宙推動(dòng)數(shù)字化更進(jìn)一步向前發(fā)展,它的特征是我們信息空間本來只有物理空間一直過去,比如我們拍張照片,拍張視頻這是物理空間變成了數(shù)據(jù),然后把它映射到信息空間,但元宇宙很多東西都是世界不存在,由我們?nèi)四X構(gòu)想出來的虛擬空間,把這個(gè)思想構(gòu)成數(shù)據(jù)以后映射到空間中去,這樣就形成我們數(shù)據(jù)的第四個(gè)爆發(fā)點(diǎn)。

很多人說數(shù)據(jù)化后面應(yīng)該是智能化,那么智能化在哪里呢,實(shí)際上我認(rèn)為智能化是包括在數(shù)據(jù)化之中的,剛開始比較弱而已,然后逐漸從弱智變成比較聰明到現(xiàn)在是很聰明,可以識(shí)別圖像人臉,最近由于深度學(xué)習(xí)算法的流行,所以大家對(duì)智能化看的比較重,實(shí)際上智能化這個(gè)步伐還在繼續(xù)深入,智能化是隱含在這個(gè)數(shù)字化之中的,元宇宙時(shí)間點(diǎn)提前了,因?yàn)楦鞔蠊粳F(xiàn)在都涌入元宇宙這個(gè)領(lǐng)域,其標(biāo)志性事件就是Facebook把它的名字改成了Meta。

元宇宙時(shí)間點(diǎn)提前,將改寫IDC數(shù)據(jù)量增長(zhǎng)預(yù)測(cè)

元宇宙是一種動(dòng)態(tài)的交互式的、沉浸式的全景圖像,會(huì)引起數(shù)據(jù)量的大爆發(fā),比高清視頻數(shù)據(jù)量大很多倍,所以存儲(chǔ)需求呈跳躍式增長(zhǎng),那么一個(gè)平行于人腦的獨(dú)立的虛擬空間將是元宇宙發(fā)展的高級(jí)階段。

我們這樣假設(shè)一個(gè)場(chǎng)景,你與元宇宙中的虛擬人自由的交談,他是具有智慧的,那么這種就是元宇宙一個(gè)高級(jí)階段,就是他不依賴于人腦,而自己在虛擬空間有他的智慧,這還有一段時(shí)間。

那存儲(chǔ)的驅(qū)動(dòng)力二是主流介質(zhì)的變更。硬盤從早期1956年的大硬盤到現(xiàn)在的高容量硬盤經(jīng)歷了水平記錄,中間一個(gè)巨磁阻效應(yīng)還得了諾貝爾獎(jiǎng),垂直記錄還有現(xiàn)在的瓦記錄還有即將出現(xiàn)的熱輔助磁記錄,容量提高了這個(gè)倍數(shù)是好幾個(gè)數(shù)量級(jí)。

1984年發(fā)明的NAND閃存目前成為手機(jī)、筆記本電腦的主流介質(zhì),而且金融數(shù)據(jù)中心固態(tài)盤,大量固態(tài)盤采用,到2026年固態(tài)盤每單位容量的成本就和硬盤持平,所以形成一類主流介質(zhì)。第三類主流介質(zhì)就是現(xiàn)在非易失的存儲(chǔ)器,那么現(xiàn)在有相變、磁變、阻變?nèi)N,大批量進(jìn)入商業(yè)化的就是第一種叫 3D XPoint技術(shù),現(xiàn)在已經(jīng)開始進(jìn)入市場(chǎng),不過價(jià)格現(xiàn)在還比較貴。

新的介質(zhì)具有帶來體系結(jié)構(gòu)和軟件的改變。我們教科書上的老三樣,cache、DRAM、 硬盤,現(xiàn)在變成了多個(gè)層,固態(tài)盤和非易失固態(tài)盤也進(jìn)來了,還有非易失內(nèi)存,這樣存儲(chǔ)結(jié)構(gòu)得到很大變革,而且介質(zhì)變快,相對(duì)來說其軟件占比比較大,硬盤的軟件開銷只占0.3%,而NVM DIMM這個(gè)新介質(zhì),軟件開銷占到94%,這是UCSD的研究結(jié)果,所以我們現(xiàn)在由于介質(zhì)的改變帶來整體軟件改變。

驅(qū)動(dòng)力三是冷數(shù)據(jù)的挑戰(zhàn)。冷數(shù)據(jù)在過去還不覺得是個(gè)壓力,但是現(xiàn)在各大互聯(lián)網(wǎng)公司、數(shù)據(jù)中心感覺這個(gè)冷數(shù)據(jù)壓力越來越大。什么是冷數(shù)據(jù),我們舉個(gè)例子就是我們每天微信朋友圈發(fā)照片,每天的騰訊那兒是10億張,10億張上去就有很多人點(diǎn)擊,訪問量就是百億次的,這是熱數(shù)據(jù),但是第二天訪問量馬上下來就變冷了,一個(gè)星期以后就沒什么人看了,這就是冷數(shù)據(jù)。

但冷數(shù)據(jù)你不能丟,日積月累下來就是一個(gè)巨大的量,結(jié)果這些公司發(fā)現(xiàn)這個(gè)冷數(shù)據(jù)現(xiàn)在越來越承受不了,冷數(shù)據(jù)是Cold Data,他既是大數(shù)據(jù)(Big Data),又是保持時(shí)間很長(zhǎng)的長(zhǎng)數(shù)據(jù)(Long Data),帶來成本挑戰(zhàn)、能耗挑戰(zhàn)和壽命挑戰(zhàn),我們現(xiàn)在大部分用的硬盤,一個(gè)數(shù)據(jù)中心可能有幾十萬個(gè)硬盤甚至上百萬的硬盤,這樣消耗巨大的能量,而且硬盤發(fā)熱,還要用很大的電力來冷卻,壽命也只有五年,隔五年就要換一批,所以這個(gè)成本,遷移成本非常非常大。

這種挑戰(zhàn)如何應(yīng)對(duì)?我們現(xiàn)在一個(gè)是磁帶,但我們中國(guó)發(fā)展光存儲(chǔ)。新的光存儲(chǔ)有4種,一種是藍(lán)光技術(shù)上發(fā)展叫AD現(xiàn)在有300G和500G兩種,還有第二是全息光存儲(chǔ)。第三種是超分辨光存儲(chǔ),就是把光點(diǎn)縮小到以前的1/10,這樣的容量就會(huì)大大提高,而且可以記多層,這個(gè)理論上可以達(dá)到500TB的容量。還有現(xiàn)在在玻璃上用多維的方式來記錄,他是用飛馬激光打上一個(gè)微小的微納結(jié)構(gòu),這樣每張盤可以存300個(gè)T,而壽命幾乎是無限的,這樣是一個(gè)永久保存技術(shù),能很好解決冷數(shù)據(jù)問題。

如何構(gòu)建完善的存儲(chǔ)技術(shù)生態(tài)系統(tǒng)?

我國(guó)存儲(chǔ)產(chǎn)業(yè)取得很大進(jìn)步,國(guó)內(nèi)市場(chǎng)已占據(jù)主導(dǎo),但生態(tài)還比較脆弱,主要問題有三個(gè)。

第一完全沒有硬盤工業(yè),硬盤全部依賴進(jìn)口,大量數(shù)據(jù)一旦硬盤進(jìn)口出問題是非常嚴(yán)重的,所以這是非常脆弱的一個(gè)點(diǎn);

第二點(diǎn)我們?cè)趪?guó)際標(biāo)準(zhǔn)上基本沒有話語權(quán),比如說NVMe這種標(biāo)準(zhǔn)我們是沒有話語權(quán),我們?cè)谕ㄓ嶎I(lǐng)域有很多話語權(quán),在存儲(chǔ)領(lǐng)域沒有,在評(píng)測(cè)領(lǐng)域也沒有,比如說我們的存儲(chǔ)大廠都想擠入Gartler的存儲(chǔ)魔力象限,企業(yè)要打榜存儲(chǔ)性能評(píng)測(cè)SPC-1才覺得我們得到承認(rèn),還有我們質(zhì)量的檢測(cè)要通過美國(guó)的IOL交互器實(shí)驗(yàn)室得到測(cè)試才能得到承認(rèn)。

如何解決,第一我提出用光、電來代磁,我們要大力發(fā)展NAND固態(tài)盤產(chǎn)業(yè)和光存儲(chǔ)產(chǎn)業(yè),因?yàn)槲覀儸F(xiàn)在長(zhǎng)江存儲(chǔ)可以生產(chǎn)閃存芯片了,現(xiàn)在產(chǎn)能還非常小,但要擴(kuò)大產(chǎn)能滿足國(guó)內(nèi)需要,我們發(fā)展固態(tài)盤完全有能力的這是存熱數(shù)據(jù)。冷數(shù)據(jù)國(guó)外是磁帶,我們現(xiàn)在要發(fā)展剛才說的新一代光盤,用新一代光盤做成我們大容量的光盤庫,就可以解決冷數(shù)據(jù)問題。第三我們要建成自己的評(píng)測(cè)體系,形成權(quán)威第三方機(jī)構(gòu),至少我們自己的企業(yè)要認(rèn)可我們的評(píng)測(cè)機(jī)構(gòu)、評(píng)測(cè)的結(jié)果,最后是想要世界上的企業(yè)也認(rèn)可我們的評(píng)測(cè)結(jié)果,這才是我們生態(tài)要完善的這樣一個(gè)局面。

結(jié)論

宇宙的一切皆可以由數(shù)來表達(dá)!這就是我們數(shù)字化一個(gè)非常終極的目標(biāo)。我們存儲(chǔ)是數(shù)據(jù)的載體,因此,發(fā)展機(jī)會(huì)也是無限的。存儲(chǔ)技術(shù)有三種驅(qū)動(dòng)力,第一是數(shù)字化進(jìn)程的步伐加快;第二是主流存儲(chǔ)介質(zhì)的更新?lián)Q代;第三是冷數(shù)據(jù)的挑戰(zhàn)。

我們要完善我們存儲(chǔ)生態(tài)鏈三條措施。第一用電光代磁;第二加強(qiáng)引領(lǐng)性核心技術(shù)的研發(fā),掌握標(biāo)準(zhǔn)領(lǐng)域的話語權(quán);第三加強(qiáng)評(píng)測(cè)體系建設(shè),爭(zhēng)取評(píng)測(cè)領(lǐng)域的話語權(quán),我的報(bào)告到此為止,謝謝大家!

分享到

崔歡歡

相關(guān)推薦