這三部分存儲(chǔ)空間承載的I/O并發(fā)流速并不一樣,每個(gè)I/O流的I/O模式也各不相同,如SU-1的臨時(shí)存儲(chǔ)一共有四個(gè)并發(fā)流,其中三個(gè)都是8KB,另外一個(gè)流是混合流,速率從4K到64K不等,同時(shí)I/O流下發(fā)到盡管分出來差不多45的空間里,每個(gè)I/O流真正訪問存儲(chǔ)池或者卷,其存儲(chǔ)空間的范圍也不一樣。
這些數(shù)據(jù)是捕捉了大量的workload后進(jìn)行的一個(gè)系統(tǒng)統(tǒng)計(jì)分析,以嘗試能夠在實(shí)驗(yàn)室環(huán)境里面進(jìn)行復(fù)原。
測(cè)試流程分為預(yù)埋數(shù)據(jù)、預(yù)埋數(shù)據(jù)監(jiān)測(cè)以及數(shù)據(jù)收集,收集的各種性能數(shù)據(jù)涉及不同負(fù)載,時(shí)間可能長(zhǎng)達(dá)到十幾個(gè)小時(shí),負(fù)載壓力從百分之百滿載按十個(gè)百分點(diǎn)下降或上升,之后再進(jìn)行數(shù)據(jù)驗(yàn)證,檢測(cè)數(shù)據(jù)是否為當(dāng)時(shí)定義的數(shù)據(jù)模式,最后進(jìn)入系統(tǒng),這個(gè)時(shí)候會(huì)做一些控制器重啟,檢測(cè)可靠性等方面的能力。
全閃存最關(guān)注也是行業(yè)客戶尚未關(guān)注到的I/O規(guī)格指標(biāo)有哪些?浪潮最后得出的結(jié)論如下:
一是響應(yīng)時(shí)間。
響應(yīng)時(shí)間分成兩類,一是百分之百滿負(fù)載壓力情況下,二是有選擇的、不等負(fù)載力度環(huán)境下進(jìn)行復(fù)雜運(yùn)算(這種狀態(tài)下客戶可以感知到性能、感知到響應(yīng)時(shí)間)。
二是延遲。
硬盤時(shí)代、響應(yīng)時(shí)間為毫秒級(jí)的時(shí)候,尾延遲并不重要,但如果平均延時(shí)在一毫秒的時(shí)候,突然蹦出數(shù)十毫秒的響應(yīng),可能就要出問題了,因?yàn)榇蠹乙恢绷?xí)慣了非??焖俚捻憫?yīng)。不管延遲是99%,99.999%,誤差都需要在5%這樣一個(gè)時(shí)間范圍內(nèi)。
1.全閃Workload對(duì)比:從行業(yè)中來,到行業(yè)中去
目前,浪潮存儲(chǔ)正嘗試把全閃存應(yīng)用最多的金融、通信以及AI等主流行業(yè)合作一起制訂相應(yīng)的行業(yè)標(biāo)準(zhǔn)。在金融行業(yè),浪潮存儲(chǔ)從2019年1月參與制訂全閃的技術(shù)規(guī)范測(cè)試規(guī)范,也了解到這些行業(yè)的頂級(jí)企業(yè)在集采和入圍采購(gòu)環(huán)境下從混閃到全閃對(duì)workload的性能要求和規(guī)格變化,覆蓋控制器升級(jí)/故障性能,盤故障、RAID重建性能。對(duì)比發(fā)現(xiàn),通信和金融行業(yè)相對(duì)比較完善,AI在彈性能力和數(shù)據(jù)服務(wù)疊加領(lǐng)域還未涉及。
通過梳理后建立了三個(gè)緯度:
一是基準(zhǔn)模式,包括業(yè)界熟知的I/O大小、隨機(jī)順序等;
二是彈性能力,如在客戶生產(chǎn)應(yīng)用的生命周期需要進(jìn)行維護(hù),包括綜合橫向的擴(kuò)容、軟件的升級(jí),在真正出現(xiàn)這樣那樣軟硬件的故障期間、恢復(fù)以后等的性能表現(xiàn);
三是數(shù)據(jù)服務(wù)疊加。
從這三個(gè)方面來看規(guī)格指標(biāo)的定義,SPC-1的workload指標(biāo)定義與行業(yè)客戶匯總起來的定義其實(shí)有偏差,各有長(zhǎng)短,但是相對(duì)來說在基準(zhǔn)測(cè)試模型方面,SPC的定義更系統(tǒng)、更完整。
2.全閃存儲(chǔ)性能 場(chǎng)景關(guān)鍵能力之重
為什么業(yè)界對(duì)全閃系統(tǒng)更關(guān)注性能和workload、如何獲取workload、如何存放存放workload,需要什么樣的工具?
另一家行業(yè)組織,全球網(wǎng)絡(luò)存儲(chǔ)工業(yè)協(xié)會(huì)(Storage Networking Industry Association,簡(jiǎn)稱SNIA)十多年前專門運(yùn)作了類似的技術(shù)工作組并發(fā)布了相應(yīng)的工具,不過業(yè)界參與的積極性還不夠高。
在浪潮存儲(chǔ)眼里,其實(shí)這是非常好的合作機(jī)會(huì)。
浪潮存儲(chǔ)正在與部分高校合作。在溝通中發(fā)現(xiàn),高等院校很希望接觸到生產(chǎn)環(huán)境的測(cè)試,“從那兒挖掘出一些廠商以為是礦但高校認(rèn)為是金子的好東西來”。
為了評(píng)估抓獲workload存放產(chǎn)生負(fù)載,市場(chǎng)上已經(jīng)推出了十多個(gè)工具,受到國(guó)內(nèi)行業(yè)客戶青睞的是vdbench,作為開源產(chǎn)品,由于創(chuàng)作者已經(jīng)退休,所以該工具并沒有得到持續(xù)維護(hù),也一樣存在有待于解決的問題。
無論是SPC還是IO500等專業(yè)工具以及商業(yè)工具、開源工具,除了體系梳理,將來也會(huì)存在變革的機(jī)會(huì)。
為什么要考慮全閃性能在場(chǎng)景存儲(chǔ)關(guān)鍵能力上所處的位置?Gartner從2016年到2019年《全閃關(guān)鍵能力(critical capabilities)報(bào)告》時(shí)間軸變化中,把全閃存存儲(chǔ)產(chǎn)品服務(wù)的IT應(yīng)用場(chǎng)景分為五大類:在線交易、服務(wù)器虛擬化、高性能計(jì)算、數(shù)據(jù)分析和VDI;這五大場(chǎng)景中,Gartner收集的是真實(shí)客戶使用IT基礎(chǔ)設(shè)施的體驗(yàn),以及從浪潮這樣的存儲(chǔ)廠商方面獲取的信息。
通過建立相應(yīng)的權(quán)重,可以看到性能在全閃的7項(xiàng)關(guān)鍵能力中在5大場(chǎng)景占據(jù)4個(gè)權(quán)重第一,其中虛擬桌面排名第二位,虛擬桌面存儲(chǔ)的不全是持久的數(shù)據(jù),也有一些虛擬機(jī)OS相關(guān)的臨時(shí)文件,這部分?jǐn)?shù)據(jù)如果出現(xiàn)問題,產(chǎn)生的影響不大,畢竟VDI客戶關(guān)心的是數(shù)據(jù)的效率服務(wù),比如重刪、壓縮等,后者比重占20%~40%;高性能計(jì)算的比重從42%提升至44%、數(shù)據(jù)分析場(chǎng)景從25%提升至36%,在線交易場(chǎng)景由28%降為26%,其他場(chǎng)景無變化。
Gartner的《全閃關(guān)鍵能力報(bào)告》中表明,廠商和客戶應(yīng)用關(guān)注的重點(diǎn)都在性能方面,并且正在加大研發(fā)領(lǐng)域的投入;性能,也堪稱全閃存存儲(chǔ)關(guān)鍵的因素。
3.存儲(chǔ)負(fù)載與性能規(guī)格指標(biāo)體系
依據(jù)各三方機(jī)構(gòu)、行業(yè)客戶的匯總信息,其建立的全閃存儲(chǔ)工作負(fù)載、規(guī)格指標(biāo)等其實(shí)各有短長(zhǎng);廠商也有責(zé)任和義務(wù)幫助用戶明確workload要覆蓋哪些、哪些是主流的、哪些是場(chǎng)景所需要不同的路徑,同時(shí)也需要開發(fā)出自己能夠捕獲workload的測(cè)試工具,并在實(shí)驗(yàn)室里面可以重放,每一個(gè)新產(chǎn)品、新技術(shù)上市之前要做好驗(yàn)測(cè),和一些場(chǎng)景結(jié)合定義方案。
浪潮存儲(chǔ)對(duì)性能矩陣進(jìn)行了結(jié)構(gòu)化梳理,用一頁(yè)P(yáng)PT來呈現(xiàn),組合了數(shù)千workload要素:一是基準(zhǔn),二是服務(wù)疊加,如快照、復(fù)制、雙活以及壓縮、重刪等,三是在應(yīng)用生命周期發(fā)生的擴(kuò)容、升級(jí)、故障,維護(hù)等工作在遷移workload上面的性能指標(biāo)。
最龐大的是基礎(chǔ)。PPT對(duì)IOPS、I/O Sizes、隨機(jī)順序、讀寫比例等業(yè)界熟知的概念進(jìn)行更多抽象化梳理,從而展示了一個(gè)樹型的、從上往下,在橢圓形框中并行的選項(xiàng),但真實(shí)生產(chǎn)應(yīng)用環(huán)境存儲(chǔ)負(fù)載遠(yuǎn)遠(yuǎn)不止一條路徑,可能下來后有8條、16條幾十條的路徑下來,需要收集大量的規(guī)格指標(biāo)。
4.全閃存儲(chǔ)面臨性能瓶頸
全閃的性能,多好算好,是不是已經(jīng)足夠好,發(fā)展到了盡頭?
眾所周知,時(shí)下計(jì)算機(jī)、服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)設(shè)計(jì),都是遵從上世紀(jì)40年代的馮諾依曼架構(gòu),其I/O處理能力有兩個(gè)基本的要求:容量按需增長(zhǎng)、與計(jì)算處理一致的速度。在過去5年,CPU遠(yuǎn)遠(yuǎn)不及摩爾定律翻番的要求,人工智能GPU/NPU算力正在接棒CPU,延續(xù)高速增長(zhǎng)摩爾定律,加劇存儲(chǔ)I/O性能問題嚴(yán)重性。
站在今天的角度看明天,存儲(chǔ)系統(tǒng)瓶頸已經(jīng)很明顯,NVMe(PCIeG3-G5)和DIMM成為SCM接口,并發(fā)效率極高,非易失性介質(zhì)正在進(jìn)化到存儲(chǔ)級(jí)內(nèi)存,訪問速度的提升尤其是延遲的降低呈百倍級(jí)的變化,達(dá)到微秒級(jí),而帶寬隨著PCIe的升級(jí)也是5至10倍的提升,曾經(jīng)的16G正在向25G、64G、100G這樣的高速存儲(chǔ)發(fā)展。
借用行業(yè)兩個(gè)經(jīng)典報(bào)告《Redrawing the boundaries of software and Fast Memory 》與《Hennessy and Patterson, Computer Architecture》的數(shù)據(jù)來展示從硬盤時(shí)代到SAS SSD,NVMe SSD到DIMM的SCM介質(zhì),軟件棧在延遲方面所占的權(quán)重越來越高,從不足1%到90%以上,即軟件棧的延時(shí)瓶頸;而CPU的性能過去5年僅有5%的增長(zhǎng),已經(jīng)成為IOPS的瓶頸。 (未完待續(xù))
【下期話題:存儲(chǔ)性能增長(zhǎng)技術(shù)及浪潮存儲(chǔ)的創(chuàng)新實(shí)踐】