目前HPC應用正從過去的傳統(tǒng)科研領域計算密集型,逐漸向新興的大數(shù)據(jù)、人工智能以及深度學習等方向進行融合和演進。繼而,數(shù)字時代無論是智能制造、智慧醫(yī)療、智慧城市、智能家居,HPC都將成為核心技術。特別是近兩年備受關注的人工智能領域,如自動駕駛汽車、無人機、人臉識別、醫(yī)療診斷以及金融分析和商業(yè)決策等,其核心是大數(shù)據(jù)支持,HPC成為人工智能模型訓練的重要支撐平臺。
HPC通過極快的處理速度,獲取大量數(shù)據(jù)進行復雜的運算,實現(xiàn)數(shù)據(jù)即時分析,達到快速決策的目標。因此,HPC機群對于存儲有著較高的性能要求,保證來自多個HPC服務器密集而多樣的分析行為。
同時,由于未分析的原始數(shù)據(jù)會越積越多,并且未來還會有更多的數(shù)據(jù)需要研究/處理,因此容量和擴展性也是重要的考慮因素。HPC的總體數(shù)據(jù)最終會達到PB級別,需要超大的存儲容量才能完成歸檔。
在HPC應用環(huán)境下,業(yè)務軟件眾多(其中運行的應用算例各不相同),從而導致不同的業(yè)務對I/O負載要求不同,其中包括帶寬型、IPOS型、元數(shù)據(jù)OPS密集型、及基于MPI框架的應用需要并行訪問同一個文件的并行I/O等。例如,在新興的AI場景中會牽涉到預處理階段、訓練階段和仿真等階段,都對帶寬及IOPS有著各不相同的高要求。
在傳統(tǒng)的油氣勘探典型場景中,假設需要同時滿足震資料處理和地震資料解釋兩種應用場景對IO負載的不同要求,通常需要為其分別配置存儲A及存儲B,以滿足不同的IO負載性能。因此,在HPC應用的場景下,滿足高帶寬、高IOPS及低時延的混合負載模型是HPC存儲面臨的巨大挑戰(zhàn)。
?性能衡量標準
帶寬型業(yè)務的衡量標準(單位時間內(nèi)的數(shù)據(jù)總吞吐量),主要特點有每個I/O大且處理次數(shù)少,單次I/O處理時間較長;IOPS型業(yè)務性能衡量標準(單位時間內(nèi)處理的總I/O請求,及每個I/O處理的時長),主要特點是單位時間內(nèi)I/O請求頻度較高,I/O請求量大,且處理時間較短;使用同一個存儲設備,在混合負載的情況下主要沖突體現(xiàn)在:CPU調(diào)度策略,帶寬型業(yè)務與IOPS型業(yè)務呈現(xiàn)為相反的調(diào)度策略,傳統(tǒng)技術無法實現(xiàn)帶寬型業(yè)務與IOPS型業(yè)務計算性能的雙重保障。
?軟件棧調(diào)度策略要求
混合負載下同樣存在軟件調(diào)用棧處理的邏輯沖突,物理性能瓶頸主要存在網(wǎng)絡帶寬、硬件帶寬及內(nèi)存帶寬上。要想減少性能瓶頸就要通過減少網(wǎng)絡轉發(fā)、減少內(nèi)存訪問實現(xiàn)、降低數(shù)據(jù)冗余。繼而與IOPS型業(yè)務產(chǎn)生沖突,在IOPS的應用場景下,性能瓶頸主要集中在CPU算力及軟件調(diào)用棧深度,需要通過降低I/O請求的放大量,從而降低軟件調(diào)用棧的深度。因此,在同一設備中,既要保障帶寬型業(yè)務場景的處理性能,又要確保IOPS型業(yè)務場景性能,給存儲系統(tǒng)的處理邏輯帶來了巨大的挑戰(zhàn)。
介質訪問模型
另外針對不同的業(yè)務類型,最佳的訪問模型也各不相同。要求I/O越大,通過磁頭、柱面和扇區(qū)組成的(3D參數(shù))使得磁盤LBA連續(xù)度越高,則帶寬型業(yè)務的性能越高。然而,針對IOPS場景,I/O的大小與磁盤管理的顆粒度越匹配,則性能越高。因此,在混合負載下,主要問題體現(xiàn)在,數(shù)據(jù)布局如何兼顧I/O不同需求。
柏科數(shù)據(jù)ISCould分布式存儲可采用多維度創(chuàng)新信息技術來解決HPC場景下混合負載沖突帶寬機IOPS業(yè)務共存問題,分別通過一系列關鍵技術實現(xiàn)極致帶寬性能及IOPS性能。
混合負載性能雙優(yōu)化
通過I/O直通存儲技術將前端應用寫入的大I/O直通存儲到節(jié)點的存儲層,以減少網(wǎng)絡帶寬、硬件帶寬及內(nèi)存帶寬的帶寬放大問題。小I/O則通過RDMA直接內(nèi)存訪問技術,將分散在其他存儲節(jié)點小I/O進行聚合存儲,隨即寫入到非易失性高速存儲介質,可進一步降低CPU的消耗。既保證了帶寬型業(yè)務中帶寬問題,又提升了IOPS的性能。同時采用,分布式糾刪技術,對元數(shù)據(jù)節(jié)點進行存儲,可通過糾刪碼算法將原始數(shù)據(jù)進行編碼,不僅保障了數(shù)據(jù)安全性,同時實現(xiàn)存儲空間高可用。
?軟件棧智能調(diào)度
為了進一步實現(xiàn)混合負載下的最佳性能,通過CPU智能分組算法及全方位QoS管理技術,來實現(xiàn)自適I/O大小的軟件棧調(diào)用能力。軟件棧智能調(diào)度是通過大小I/O的特點,通過CPU動態(tài)分組技術,實現(xiàn)CPU自動歸屬應用,為不同要求的I/O實行專核專用的策略,保障關鍵業(yè)務運行及IOPS業(yè)務快速響應。同時,ISCould分布式存儲可智能識別IOPS優(yōu)先級別,采用全方位QoS管理技術,確保前臺優(yōu)于后臺的機制。充分實現(xiàn)混合負載下的極致低時延。
智能處理策略
目前磁盤管理通常采用Write in place的管理方式,這種管理方式在長時間的運行之后,由于數(shù)據(jù)及部分文件反復創(chuàng)建、重刪,會導致傳統(tǒng)數(shù)據(jù)碎片化嚴重。大I/O寫入會被拆解成多個小I/O,使得磁盤LBA連續(xù)度越低。通過兩次智能處理策略,首先通過智能數(shù)據(jù)處理技術,可將數(shù)據(jù)寫入連續(xù)的磁盤空間中,將無效數(shù)據(jù)在后臺進行垃圾回收。在通過對象組智能平衡技術,對磁盤進行實時監(jiān)控 、動態(tài)計算, 自動調(diào)整磁盤空間。