提升單臺設(shè)備服務(wù)能力
周超勇介紹說,金山云CDN業(yè)務(wù)增長迅猛,儲備帶寬突破100Tbps規(guī)模。CDN行業(yè)是成本敏感型行業(yè),隨著帶寬的增長,成本壓力也越來越大,提高單臺設(shè)備的服務(wù)能力是金山云CDN研發(fā)團隊的工作重心之一。
所謂單臺設(shè)備的服務(wù)能力,主要是指單臺設(shè)備所能提供的加速帶寬,而服務(wù)器透過帶寬輸出的數(shù)據(jù)流量往往受限于磁盤I/O,磁盤的帶寬低就算網(wǎng)卡再快也無濟于事。換言之,在CDN節(jié)點的服務(wù)器上,磁盤才是單臺服務(wù)器服務(wù)能力的瓶頸。
為了提高單臺服務(wù)器的服務(wù)能力,金山云選擇了英特爾今年新發(fā)布的第二代至強可擴展處理器加上QLC NVMe SSD和25G網(wǎng)卡的解決方案,從計算能力到存儲能力都有大幅提升。
普通SATA HDD的混合讀寫能力是40MB/s,普通SATA SSD的混合讀寫能力是150MB/s的水平。金山云CDN實測發(fā)現(xiàn),混合讀寫場景下,英特爾的QLC NVMe SSD讀性能達到3GB/s,寫性能達到1GB/s,多盤加持下的單臺服務(wù)器IO能比較充分地發(fā)揮25G網(wǎng)卡的吞吐能力。
去年開始,英特爾在市場上推出創(chuàng)新的QLC NVMe SSD,單GB容量成本(Price per GB)相對于TLC有了大幅下降。與此同時,寫壽命(DWPD)相對于TLC NAND也有所降低,金山云最初是有所顧慮的,但經(jīng)過了許多理論計算和真實業(yè)務(wù)測試,并且在軟件上采取了一系列優(yōu)化措施和技術(shù)革新后,最終有了QLC在CDN場景下的第一次突破性的應(yīng)用。
2019年8月,金山云在生產(chǎn)環(huán)境上線這一解決方案后發(fā)現(xiàn),單臺服務(wù)器的服務(wù)能力提升了四倍。雖然,單臺設(shè)備的成本有所增加,但是整體性價比以及服務(wù)質(zhì)量有了明顯提升。
降低CDN運營成本
單臺設(shè)備能力的提升不僅僅是提升性價比,更重要的是,新的方案能降低金山云CDN業(yè)務(wù)的運營成本,這點對于成本敏感型的CDN行業(yè)至關(guān)重要。
CDN行業(yè)IT資源方面的投入成本一部分是硬件購置成本,而更主要的是另外一部分帶寬成本。帶寬成本主要分為兩部分,一部分是用戶訪問邊緣節(jié)點產(chǎn)生的帶寬成本,為正常業(yè)務(wù)消耗,另一部分則是回源帶寬成本,通常由CDN廠商承擔。所謂回源帶寬成本是指CDN節(jié)點從源站獲取資源過程產(chǎn)生的帶寬成本。金山云CDN技術(shù)總監(jiān)斯文介紹說,金山云CDN使用QLC加上高端的CPU和網(wǎng)卡之后,可以建設(shè)更大的節(jié)點,合并回源帶寬,從而減少回源帶寬成本。
CDN的基本原理是,每個CDN節(jié)點需要從源站獲取數(shù)據(jù)并緩存到本地,當終端用戶需要這些數(shù)據(jù)的時候,網(wǎng)絡(luò)會直接從最近的CDN節(jié)點獲取數(shù)據(jù),用戶的加速體驗會比較好。但是,當用戶訪問CDN節(jié)點上沒有的數(shù)據(jù)時,就需要從源站獲取這些數(shù)據(jù),這就是回源,回源占用的帶寬是CDN廠商日常最耗費成本的地方。
對于金山云CDN來說,單臺設(shè)備服務(wù)能力的提升,首先意味著同樣硬件配置的節(jié)點可以提供更高的網(wǎng)絡(luò)流量輸出能力;其次,從金山云CDN整體業(yè)務(wù)規(guī)劃和帶寬規(guī)模來看,單個CDN節(jié)點的服務(wù)能力有了質(zhì)的提升之后,就可以建設(shè)更大規(guī)模的節(jié)點,滿足支撐100Tbps帶寬的成本要求,滿足低延遲、高吞吐量和業(yè)務(wù)全覆蓋的目標。這就是金山云CDN選用第二代至強可擴展處理器+QLC+25G網(wǎng)卡方案最終能降低成本、獲得競爭力的原因。
或?qū)⒄饎?/strong>CDN行業(yè)
周超勇介紹說,在CDN上采用第二代至強可擴展處理器加上QLC NVMe SSD和25G網(wǎng)卡的解決方案,在行業(yè)是一次顛覆,并且認為未來可能會震動CDN行業(yè),引發(fā)CDN市場版圖的變更。不過,新硬件的引入存在一定的門檻。
周超勇表示,原來的瓶頸主要是硬件,而現(xiàn)在硬件的提升又給軟件帶來了很大的優(yōu)化空間。金山云CDN在英特爾專家的協(xié)助下克服來自包括軟件和硬件方面的多重挑戰(zhàn),已經(jīng)將單臺設(shè)備的服務(wù)能力提升了4倍,但同時也表示,這一結(jié)果離硬件能力的上限還有大約30%的距離,仍有很大空間去做優(yōu)化提升。
金山云CDN在技術(shù)上大概領(lǐng)先業(yè)內(nèi)一年。軟件優(yōu)化和革新體現(xiàn)了金山云CDN技術(shù)積累的優(yōu)勢,這也是除了成本以外,金山云跟友商拉開差距的地方,而新的硬件方案的引入可以幫助金山云CDN鞏固優(yōu)勢。