對話從圖靈機切入,謝長生表示很高興提到圖靈機的模式。他指出:現(xiàn)在商用的信息系統(tǒng)、計算系統(tǒng)都是在圖靈框架的指導(dǎo)下,當(dāng)代計算模式的根就在這里。都說大道至簡,存儲就是那個無線長的帶子,磁頭讀寫就是處理,帶子移動就是數(shù)據(jù)傳輸,圖靈機已經(jīng)說得很簡單了。理論告訴我們:存儲第一要大,第二要快,如今AI、云計算都要非常大的算力,需要存儲能夠跟上,圍繞著容量、處理性能做文章。
李輝認為這就是計算、存儲要協(xié)同發(fā)展,計算的算力在一直前進,存儲也要在容量和性能上能夠跟計算匹配,并駕齊驅(qū)。“只要我們能夠有無限的算力,只要我們能有無限的數(shù)據(jù),我們就能計算整個世界。這句話讓我印象很深?!?李輝說。
那么,計算和存儲匹配嗎?
李輝的觀點是:在人工智能這種應(yīng)用場景里面有三個核心的東西:數(shù)據(jù)、算力和算法。新的人工智能模型 GPT-3,模型參數(shù)已有100多個億;類腦計算模型參數(shù)要到幾百萬億,對于存儲而言,這意味數(shù)據(jù)帶寬還要有比較大的提高。
“應(yīng)對當(dāng)前人工智能計算應(yīng)用,我們的存儲是夠的,但是隨著新的人工智能模型的演進,所謂硅級計算、碳級計算,就是類腦接近人腦的話,無論是計算還是存儲,都還有很大的空間和距離,等著去探索和提升。” 李輝說。
更加具體一些,在存儲介質(zhì)技術(shù)的進步上已經(jīng)突破了瓶頸,目前存儲的瓶頸是在傳輸和網(wǎng)絡(luò)上,無論是節(jié)點內(nèi)數(shù)據(jù)高速處理,還是節(jié)點間海量的數(shù)據(jù)同步上,都需要在互聯(lián)或者在網(wǎng)絡(luò)上、傳輸上再做更多的工作,像PCIe技術(shù)的進步,像100G,400G以太網(wǎng)技術(shù)進步,像MIA這樣一些新的協(xié)議技術(shù)的進步,正在往這個方向去突破。
對此,沒有異議。
接下來話題轉(zhuǎn)向了“場景共同體”。
據(jù)李輝透露::場景共同體這個概念,主要是考慮海量非結(jié)構(gòu)化數(shù)據(jù)、超大規(guī)模應(yīng)用場景下產(chǎn)生的一些新的需求。
“過去我們接觸的非結(jié)構(gòu)化數(shù)據(jù)、超大規(guī)模應(yīng)用,最常見的場景是高性能計算。但現(xiàn)在除了科學(xué)計算,又演進到智慧計算,很多已經(jīng)應(yīng)用到我們的企業(yè)級應(yīng)用場景,應(yīng)用我們的商業(yè)環(huán)境。比如說智慧交通的環(huán)境、醫(yī)療影像、醫(yī)學(xué)影像場景,以及金融里面的一些場景,包括互聯(lián)網(wǎng)里面的視頻應(yīng)用場景,金融里面的大數(shù)據(jù),以及相應(yīng)的AI,這些都是非常多的一些海量的非結(jié)構(gòu)化數(shù)據(jù)大規(guī)模應(yīng)用?!彼f。
在這種大規(guī)模應(yīng)用當(dāng)中,我們看到了整個體系結(jié)構(gòu)的變化,包括現(xiàn)在上層應(yīng)用都已經(jīng)是平臺化了,比如醫(yī)療影像有醫(yī)療影像的平臺,4K、8K、高清的平臺,云計算有云的平臺,各種各樣的應(yīng)用平臺。大家都是在按照工業(yè)標準和行業(yè)標準在做自己的產(chǎn)品,在做自己的技術(shù)。但是對數(shù)據(jù)處理,每個應(yīng)用場景有它自己獨特的需求。為此,我們就提出了“場景共同體”的概念,在通用產(chǎn)品的基礎(chǔ)上,通過產(chǎn)品定制、技術(shù)的創(chuàng)新,更好去滿足這些場景對數(shù)據(jù)存儲的要求。
李輝還舉了個例子:現(xiàn)在每個醫(yī)院都有PACS應(yīng)用,以往每個醫(yī)院PACS的數(shù)據(jù),醫(yī)學(xué)影像數(shù)據(jù)是存在本地的。如果要實現(xiàn)醫(yī)學(xué)影像數(shù)據(jù)在一個城市內(nèi)的共享,建一個云存儲中心,把PACS數(shù)據(jù)上傳到一個地方,放在一個云上,就可以產(chǎn)生很多很多的價值。但其中就會碰到一個問題,數(shù)據(jù)怎么能夠非常迅速地傳到云存儲中心來,一份PACS數(shù)據(jù)可能是幾百MB,甚至是幾十GB,如果不進行壓縮,對帶寬的要求就非常高,但要壓縮,怎么樣才能實現(xiàn)無損壓縮?為此,浪潮在技術(shù)上創(chuàng)新和突破,實現(xiàn)了遠距離的、海量數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)的無損壓縮和高速傳輸。
場景化必然涉及到產(chǎn)學(xué)研用結(jié)合,所謂“場景共同體”。
謝長生指出:產(chǎn)學(xué)研結(jié)合很早就一直在提倡,但是真正做到一個很好的結(jié)合,還有很多地方要加強。早期的產(chǎn)學(xué)研合作還是一個比較低層次的,但是今天,一方面企業(yè)變的強大了,另一方面學(xué)術(shù)界也有很大進步,這必然會產(chǎn)出。
“現(xiàn)在我們的企業(yè)已經(jīng)在國際上有很強的競爭力了,有些領(lǐng)域已經(jīng)進入無人區(qū),再往前怎么走,就要靠自己探路。這個時候我們企業(yè)和大學(xué)的結(jié)合是非常有好處的,因為學(xué)校它可能就是不斷去探索前沿,看一些新方向,企業(yè)有大量的應(yīng)用需求,他會提出很多真問題來。這樣我們再一結(jié)合,這樣比過去是一個更高層次的合作,這樣就可以產(chǎn)生一些新的,甚至可以超越國外的產(chǎn)品,這樣一個情況。我相信我們國家產(chǎn)學(xué)研結(jié)合可以走向一個更高的階段,而且可以做出一些世界領(lǐng)先的東西,這個我們還是很有信心的?!?謝長生充滿信心地說。
“我們浪潮跟華中科技大學(xué)在2009年合作了一個課題,叫超大規(guī)模海量存儲,在存儲體系結(jié)構(gòu)上取得了一些突破,如怎么去解決容量問題、性能的問題、可靠性的問題,這些最終被集成到浪潮統(tǒng)一存儲。這為產(chǎn)品創(chuàng)新、產(chǎn)品工程化、市場化、產(chǎn)品化商業(yè)運作奠定了一個很好的技術(shù)基礎(chǔ)?!?李輝補充說。
“產(chǎn)學(xué)研做先行的探索,我們企業(yè)是來做接力棒的,我們要把這些創(chuàng)新和突破拿到我們的產(chǎn)品上,在工程界上去嘗試、應(yīng)用,把這些技術(shù)落地到產(chǎn)品上,最終能夠到達我們的用戶?!斑@是一個產(chǎn)學(xué)研應(yīng)該有的循環(huán)。
產(chǎn)學(xué)研用的結(jié)合會觸及到“異構(gòu)存儲“嗎?
“當(dāng)然了,異構(gòu)也有很多種說法,一個是介質(zhì)的異構(gòu),就是不同的介質(zhì),現(xiàn)在新的介質(zhì)應(yīng)該說越來越多,像英特爾有3D XPoint,我們現(xiàn)在也在跟長江存儲合作做器件。這些器件一旦成功,我們就可以用到像浪潮這樣企業(yè)的產(chǎn)品當(dāng)中。但是沒有一種存儲介質(zhì)能夠做到又大、又快、又便宜,有的非??斓呛苜F,并且做不大;有的是很便宜,但很慢,所以就需要異構(gòu)融合。“謝長生回應(yīng)說。
謝長生表示:這個系統(tǒng)里要用不同的介質(zhì)來構(gòu)成一個系統(tǒng),使它總體呈現(xiàn)出來的是一個速度又高,容量又大,又比較便宜的這樣一個虛擬的,看起來很大的這樣一個存儲系統(tǒng)。我想浪潮這種產(chǎn)品上面很多東西都是用的這種思想。
“我們跟華中科技大學(xué)的合作成果在浪潮第二代全閃存儲就開始了,我們第二代全閃存儲稱之為HF系列,今年已經(jīng)量產(chǎn)。其中就繼承了這個合作的成果,實現(xiàn)了3D Xpoint與3D TLC NAND等幾種介質(zhì)的混合使用,帶來了非常高性能和性價比?!袄钶x透露。
以場景化應(yīng)用為代表會給存儲帶來哪些變化呢?
對這個開放的話題,李輝表示:場景共同體的產(chǎn)品定制會對產(chǎn)品帶來什么樣的變化,是革命性的、顛覆性的變化,還是說只是一些延續(xù)性的、局部的變化。從目前我們對場景的認識來看,它應(yīng)該還是一個局部的,不是一個顛覆性的變化。比如車還是車,但是我這個車是園區(qū)里面用的車,還是說車站跟車站之間的這種大的公交車,還是說我的私家車,它可能會有這樣的變化。
“不確定具體會有多少場景延伸,但至少我們可以看到兩個極端的延伸:一個極端的延伸是往邊緣和終端上走,所以在邊緣計算這邊會不會出來一些架構(gòu)的重構(gòu)、形態(tài)重構(gòu)的存儲。另外一個場景就是進內(nèi)存計算,或者說這種高速的運行計算往內(nèi)存存儲這個方向,可能會有一些架構(gòu)和形態(tài)的變化,可能會衍生出新的產(chǎn)品。“他說。
在這樣一個共同意愿下,我們場景共同體有一個簡單的想法,就是專業(yè)化分工不同大家在一起,類似一個圓桌一樣,我們一個聯(lián)盟一樣,大家不是點對點,而是多點對多點,是一個全連接的交流合作方式,在這里面大家共同去解決這里面用戶碰到的問題,用戶碰到的技術(shù)問題、用戶碰到服務(wù)的問題、用戶碰到一站式整體解決方案交付的問題,我們在這里面用的是技術(shù)和商業(yè)的手段去解決問題。李輝進一步補充說。
謝長生認為:現(xiàn)在在很多場景上,像我們的CPU它就是一個通用性很強的東西,但是你要拿這個通用性的東西去解決有一些特定的問題,效率相比就會差很多。所以這種通用性和專用性的問題,這個就是看你的場景,我們還是說你的場景,你經(jīng)常性的事件是什么,假如你那個經(jīng)常性的事件主要就是快速傅里葉變換,如果它95%的時間都是要做這個的話,你用一個其他技術(shù)能比CPU要快得多了,所以它就是這個道理。就是取決于你的場景是什么,如果你的場景那個經(jīng)常性的事件占的比率非常大。
不知不覺中,對話來到了尾聲。場景共同體給存儲產(chǎn)業(yè)帶來變化才剛剛開始,讓我們共同期待!