右二為MemVerge聯(lián)合創(chuàng)始人兼CEO范承工
在很長(zhǎng)一段時(shí)間里,能否分清內(nèi)存和外存的概念一直是鑒別計(jì)算機(jī)/手機(jī)玩家專業(yè)與否的一道入門(mén)測(cè)試題。
從功能上來(lái)講,內(nèi)存和外存都是用于存儲(chǔ)和讀取數(shù)據(jù)的設(shè)備;但在經(jīng)典的馮諾依曼體系結(jié)構(gòu)中,只有內(nèi)存才屬于存儲(chǔ)器,而外存則屬于輸入/輸出設(shè)備。它們之間最為關(guān)鍵的差異不在于存取速度,而在于能否與CPU直接交換數(shù)據(jù)。
由于工作環(huán)境的不同,內(nèi)存通常只有在通電的情況下才能讀寫(xiě)內(nèi)容,一旦斷電,內(nèi)存上存儲(chǔ)的內(nèi)容也會(huì)隨之消失;而外存則須要在斷電的情況下,也能保證其所存儲(chǔ)數(shù)據(jù)的安全。
不同的功能與角色,讓內(nèi)存與外存走向了不同的進(jìn)化路線。內(nèi)存技術(shù)隨著CPU不斷迭代,頻率與帶寬成為了內(nèi)存的主要性能指標(biāo);而外存技術(shù)的進(jìn)化則更加多樣,從打孔紙帶到磁帶,從磁帶到硬盤(pán)、光碟,多種不同存儲(chǔ)介質(zhì)彼此競(jìng)爭(zhēng)、不斷迭代,容量、速度與成本的平衡是外存設(shè)備的生存準(zhǔn)則。
然而,隨著技術(shù)的進(jìn)步,內(nèi)存與外存開(kāi)始出現(xiàn)融合的跡象,英特爾和鎂光新近推出的非易失性內(nèi)存成為了介于內(nèi)存和外存的中間態(tài)產(chǎn)品。它兼具內(nèi)存的高速和固態(tài)硬盤(pán)的大容量,并且不會(huì)因斷電而失去其所存儲(chǔ)的內(nèi)容。
依托于非易失性內(nèi)存的出現(xiàn),一些新的應(yīng)用場(chǎng)景與產(chǎn)品開(kāi)始出現(xiàn),內(nèi)存融合基礎(chǔ)架構(gòu)(MCI)的發(fā)明者M(jìn)emVerge就是其中之一。
日前,MemVerge宣布完成2450萬(wàn)美元A輪融資,投資方包括高榕資本、美國(guó)光速創(chuàng)投、北極光創(chuàng)投、JVP、LDVP等。本輪融資將用于擴(kuò)大MemVerge在硅谷的工程師、銷售和市場(chǎng)團(tuán)隊(duì),加大研發(fā)投入,進(jìn)一步推動(dòng)MCI技術(shù)的發(fā)展。
我們采訪了MemVerge聯(lián)合創(chuàng)始人兼CEO范承工博士,和他聊了聊內(nèi)存融合基礎(chǔ)架構(gòu)(MCI)在人工智能領(lǐng)域的應(yīng)用。范承工畢業(yè)于加州理工學(xué)院,曾任VMware高級(jí)副總裁、EMC高級(jí)副總裁。
機(jī)器產(chǎn)生數(shù)據(jù)已超過(guò)90%
范承工表示,隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,越來(lái)越多的數(shù)據(jù)由機(jī)器直接生產(chǎn),人類輸入的數(shù)據(jù)已經(jīng)不足10%,機(jī)器產(chǎn)生的數(shù)據(jù)則超過(guò)了90%。監(jiān)控?cái)z像頭拍攝的視頻文件、聯(lián)網(wǎng)傳感器傳回的數(shù)據(jù)等等,都屬于機(jī)器產(chǎn)生的數(shù)據(jù)。每天有超過(guò)2.5億千兆字節(jié)的數(shù)據(jù)以極快的速度在人工智能、機(jī)器學(xué)習(xí)、物聯(lián)網(wǎng)和數(shù)據(jù)分析等應(yīng)用中產(chǎn)生。
人類產(chǎn)生數(shù)據(jù)通常擁有一個(gè)CRUD(Create,Read,Update,Delete)生命周期,先是創(chuàng)建,再是讀取,然后是更新,最后是刪除,這一流程也是大多數(shù)數(shù)據(jù)庫(kù)的底層設(shè)計(jì);而機(jī)器產(chǎn)生的數(shù)據(jù)的生命周期則是CRAP(Create,Read,Ad-hoc queries,Pipeline),一般機(jī)器產(chǎn)生的數(shù)據(jù)只會(huì)寫(xiě)入一次,不會(huì)經(jīng)歷多次修改,人們對(duì)于它的需求更多是實(shí)時(shí)查詢,比如從監(jiān)控?cái)?shù)據(jù)中找到嫌疑人的影像,或者從大量數(shù)據(jù)中尋找特定數(shù)據(jù)等等。
對(duì)比人類產(chǎn)生的數(shù)據(jù),機(jī)器產(chǎn)生的數(shù)據(jù)結(jié)構(gòu)化程度較差,缺乏合適的管理手段。這給互聯(lián)網(wǎng)巨頭和大型企業(yè)的數(shù)據(jù)科學(xué)家團(tuán)隊(duì)帶來(lái)了巨大挑戰(zhàn)。
人工智能、機(jī)器學(xué)習(xí)與大數(shù)據(jù)分析是處理機(jī)器產(chǎn)生數(shù)據(jù)最為主要的應(yīng)用場(chǎng)景,MemVerge希望以新的數(shù)據(jù)基礎(chǔ)架構(gòu),消除了內(nèi)存和存儲(chǔ)之間的界限,讓相關(guān)應(yīng)用能夠以更快的速度運(yùn)行,以此解決機(jī)器生成數(shù)據(jù)時(shí)代的挑戰(zhàn)。
MemVerge系統(tǒng)的核心是由英特爾和鎂光聯(lián)合推出的傲騰內(nèi)存,據(jù)范承工介紹,傲騰內(nèi)存在物理層面上屬于相變內(nèi)存(PCM,Phase-Change Memory),采用的制造工藝是3D XPoint。英特爾從1999年就開(kāi)始研發(fā)這一技術(shù),但直到近期才將其商用化。傲騰先推出了SSD產(chǎn)品,這是因?yàn)镾SD相對(duì)比較低端,在速度要求上沒(méi)有內(nèi)存那么高;而英特爾新近推出的內(nèi)存形態(tài)的傲騰內(nèi)存可以直接插到內(nèi)存插槽里,這是一個(gè)革命性的產(chǎn)品——它足夠快可以做內(nèi)存,又足夠可靠可以作為外存,這使得內(nèi)存和外存第一次有了融合的可能。
MemVerge是全新物種 將幫助企業(yè)用戶降本提效
范承工表示,MemVerge的核心產(chǎn)品是一款具有DRAM、傲騰內(nèi)存、SSD三層結(jié)構(gòu)的一體機(jī)系統(tǒng),它的內(nèi)存由DRAM加上傲騰內(nèi)存提供,它的存儲(chǔ)由SSD加上傲騰內(nèi)存提供,內(nèi)存和存儲(chǔ)共享傲騰內(nèi)存,并且根據(jù)不同的需要向企業(yè)用戶提供整合后的內(nèi)存與存儲(chǔ)邏輯接口。對(duì)比傳統(tǒng)服務(wù)器,MemVerge的一體機(jī)可以提供更大的內(nèi)存空間和更快的存儲(chǔ)速度。與目前最先進(jìn)的存儲(chǔ)和計(jì)算解決方案相比,MemVerge的內(nèi)存融合系統(tǒng)提供了10倍的內(nèi)存容量和10倍的數(shù)據(jù)I/O速度。
范承工預(yù)計(jì),在正式發(fā)布之后,MemVerge一體機(jī)的每GB存儲(chǔ)成本將會(huì)在1美元以下。
范承工表示,當(dāng)前的企業(yè)級(jí)存儲(chǔ)市場(chǎng)中,高端存儲(chǔ)系統(tǒng)的單位存儲(chǔ)價(jià)格在3~5美元/GB,中端存儲(chǔ)系統(tǒng)的單位存儲(chǔ)價(jià)格約為1~2美元/GB,低端存儲(chǔ)系統(tǒng)的價(jià)格則在50~60美分/GB。MemVerge的系統(tǒng)能夠以中端存儲(chǔ)系統(tǒng)的價(jià)格提供高于高端存儲(chǔ)系統(tǒng)的性能。
需要指出的是,MemVerge并非是傳統(tǒng)的存儲(chǔ)系統(tǒng),它是一個(gè)融合了服務(wù)器、存儲(chǔ)系統(tǒng)、軟件服務(wù)的全新物種。通過(guò)MemVerge的系統(tǒng),企業(yè)可以完成此前無(wú)法完成的事情。
例如,領(lǐng)英擁有約5.62億用戶(2018年5月數(shù)據(jù)),這些海量彼此關(guān)聯(lián)的用戶數(shù)據(jù)形成了一個(gè)復(fù)雜的“圖”(Graph),擁有數(shù)以百億計(jì)的“節(jié)點(diǎn)”和“邊”。
這里的“圖”是指是由若干給定的點(diǎn)(節(jié)點(diǎn))及連接兩點(diǎn)的線(邊)所構(gòu)成的圖形,這種圖形通常用來(lái)描述某些事物之間的某種特定關(guān)系,用點(diǎn)代表事物,用連接兩點(diǎn)的線表示相應(yīng)兩個(gè)事物間具有這種關(guān)系。
如果想通過(guò)機(jī)器學(xué)習(xí)對(duì)這個(gè)“圖”進(jìn)行訓(xùn)練和處理,這個(gè)“圖”的數(shù)據(jù)庫(kù)/模型就必須存儲(chǔ)在內(nèi)存中。此前,沒(méi)有機(jī)器擁有這么大的內(nèi)存,但現(xiàn)在,通過(guò)MemVerge的系統(tǒng),領(lǐng)英可以將多個(gè)節(jié)點(diǎn)的內(nèi)存連在一起,使得研究人員可以有足夠大的內(nèi)存完成這個(gè)工作。
由于內(nèi)存空間的大幅增長(zhǎng),MemVerge的系統(tǒng)還可以在一定程度上減少企業(yè)的成本支出,大幅削減此前受單個(gè)機(jī)器內(nèi)存空間制約而不得不添置的機(jī)器。而隨著機(jī)器整體數(shù)量的削減,企業(yè)的管理成本——耗電、空間、管理人員——也將隨之下降。
此外,MemVerge還搭建了自己的應(yīng)用商店,企業(yè)用戶可以非常方便的一鍵部署所需的開(kāi)源軟件。
目前,MemVerge還處于早期的Alpha階段,客戶包括領(lǐng)英、騰訊和京東等知名互聯(lián)網(wǎng)公司。MemVerge預(yù)計(jì)將于明年初正式推出自己的第一版產(chǎn)品。
今年6月,MemVerge將進(jìn)入Beta階段,范承工表示,希望可以有更多來(lái)自傳統(tǒng)行業(yè)的企業(yè)能夠成為MemVerge的Beta用戶。
大公司難逃創(chuàng)新者的窘境 創(chuàng)業(yè)公司更能把握新技術(shù)紅利
毫無(wú)疑問(wèn),傲騰內(nèi)存是一項(xiàng)突破性的技術(shù),它在MemVerge的系統(tǒng)中扮演著至關(guān)重要的角色。但作為一種全新的硬件產(chǎn)品,傲騰內(nèi)存的未來(lái)還有很大的不確定性。如果傲騰內(nèi)存發(fā)展不夠順利,英特爾選擇停止生產(chǎn)這種硬件,MeMVerge是否也會(huì)遭到連帶的打擊?
對(duì)此,范承工表示,傲騰內(nèi)存這類產(chǎn)品有一個(gè)統(tǒng)稱叫SCM(Storage Class Memory),意為“存儲(chǔ)級(jí)別內(nèi)存”。存儲(chǔ)級(jí)別內(nèi)存的概念在過(guò)去十年里一直是比較熱的一個(gè)概念,業(yè)界很多廠家都在研發(fā)這方面的技術(shù),比如微軟、三星、海力士等等。未來(lái)三到五年會(huì)有更多企業(yè)加入到存儲(chǔ)級(jí)別內(nèi)存的競(jìng)爭(zhēng)中來(lái)。
“英特爾的傲騰內(nèi)存只是第一家真正面市的商業(yè)級(jí)產(chǎn)品,它給了MemVerge這樣的軟件公司一個(gè)參照物,讓我們可以在上面開(kāi)發(fā)軟件產(chǎn)品?!?/p>
范承工表示,創(chuàng)業(yè)公司沒(méi)有大公司的歷史包袱,能夠更快、更徹底地?fù)肀碌募夹g(shù),推出革命性的產(chǎn)品。大公司對(duì)市場(chǎng)的掌控非常強(qiáng),對(duì)客戶掌控非常強(qiáng),但這也意味著,它對(duì)一些技術(shù)的依賴性也非常強(qiáng)。
當(dāng)大公司面對(duì)顛覆性的技術(shù),它往往會(huì)陷入“創(chuàng)新者的窘境”。從商業(yè)模式上來(lái)看,如果新的技術(shù)使得它現(xiàn)有的產(chǎn)品賣(mài)不出去,或者價(jià)格暴跌,大公司將很難做出這樣的決定;而在技術(shù)上,大公司傳統(tǒng)的架構(gòu)經(jīng)歷了過(guò)去十年或更長(zhǎng)時(shí)間的積累,這導(dǎo)致它面對(duì)新技術(shù)的自然反應(yīng)就是怎樣把這個(gè)新的東西放到它已有架構(gòu)中去,而不是為這項(xiàng)新技術(shù)做一個(gè)新的架構(gòu),這很難讓新技術(shù)發(fā)揮自己的全部?jī)?yōu)勢(shì)。
這兩個(gè)是大公司很難克服的劣勢(shì)。面對(duì)傲騰這樣的新硬件,傳統(tǒng)的數(shù)據(jù)庫(kù)公司會(huì)考慮怎樣改進(jìn)他的數(shù)據(jù)庫(kù),傳統(tǒng)的存儲(chǔ)公司會(huì)想著怎樣把這個(gè)產(chǎn)品加入已有的架構(gòu)里做一個(gè)緩存,它們都不會(huì)成為MemVerge的直接競(jìng)爭(zhēng)對(duì)手。
“它們(大公司)只會(huì)用這個(gè)新的硬件來(lái)改進(jìn)一些現(xiàn)有的產(chǎn)品,而MemVerge是則將利用這個(gè)硬件能夠做出一個(gè)嶄新的、融合的新物種。”