*以下為演講主要內(nèi)容
金融關(guān)鍵系統(tǒng)規(guī)模化替代與成本困境
自2019年起,金融行業(yè)逐步推進(jìn)安全、穩(wěn)定、可靠的信息化系統(tǒng)升級(jí)。吳良智認(rèn)為,發(fā)展至今,金融數(shù)據(jù)庫(kù)呈現(xiàn)出兩大顯著特征:其一,替換升級(jí)已邁入深水區(qū),除外圍和非核心系統(tǒng)外,關(guān)鍵業(yè)務(wù)系統(tǒng)替換升級(jí)的步伐明顯加快,對(duì)產(chǎn)品的可用性和性能提出更高要求;其二,規(guī)模化替代階段全面開(kāi)啟,原有“試點(diǎn)”階段高成本投入的方式難以適應(yīng)規(guī)?;枨?市場(chǎng)亟需在性能、高可用性、兼容性、可靠性及綜合成本方面具備顯著優(yōu)勢(shì)的解決方案。
在演講中,吳良智分享了對(duì)金融關(guān)鍵業(yè)務(wù)系統(tǒng)規(guī)?;娲夹g(shù)路徑的理解。他指出,當(dāng)前的解決方案雖有積極探索,但與規(guī)?;瘡?fù)制仍有一些差距,當(dāng)前有四大不可忽視的挑戰(zhàn)。
首先是遷移與兼容性成本高。金融業(yè)務(wù)系統(tǒng)普遍依賴 PL/SQL 存儲(chǔ)過(guò)程、自定義函數(shù)、包等高級(jí)特性,這些與業(yè)務(wù)邏輯深度綁定的功能,現(xiàn)有解決方案如無(wú)法在語(yǔ)法規(guī)則、功能實(shí)現(xiàn)上實(shí)現(xiàn)高度兼容,將迫使金融機(jī)構(gòu)投入巨大人力進(jìn)行代碼重構(gòu)與適配,不僅增加技術(shù)對(duì)接難度,更導(dǎo)致項(xiàng)目周期延長(zhǎng)、改造成本飆升。
其次是產(chǎn)品性能瓶頸。基于開(kāi)源二次開(kāi)發(fā)的數(shù)據(jù)庫(kù)產(chǎn)品其單機(jī)內(nèi)核性能天花板顯著,難以與國(guó)際主流數(shù)據(jù)庫(kù)匹敵,同時(shí)復(fù)雜查詢依賴的優(yōu)化器能力不足,成為數(shù)據(jù)處理效率的瓶頸;在事務(wù)密集型場(chǎng)景(如核心交易系統(tǒng))下,面臨時(shí)延和抖動(dòng)問(wèn)題。分布式架構(gòu)雖被視為破局方向,卻面臨新挑戰(zhàn),例如節(jié)點(diǎn)間網(wǎng)絡(luò)通信延遲影響響應(yīng)速度,分布式事務(wù)為滿足 ACID特性會(huì)產(chǎn)生性能損耗,數(shù)據(jù)分布策略會(huì)直接影響查詢效率,其在高并發(fā)、低延遲的核心交易場(chǎng)景面臨天然挑戰(zhàn)。
最后是架構(gòu)復(fù)雜度陡增。無(wú)論是分布式架構(gòu),還是交易和分析系統(tǒng)的拆分,均會(huì)導(dǎo)致復(fù)雜度變高。一方面,由于業(yè)務(wù)改造涉及數(shù)據(jù)拆分、路由配置等工作,增加了系統(tǒng)復(fù)雜度,對(duì)應(yīng)用的設(shè)計(jì)和開(kāi)發(fā)也造成非常大的挑戰(zhàn)。另一方面,由于產(chǎn)品能力瓶頸,導(dǎo)致在同一系統(tǒng)無(wú)法同時(shí)處理交易型業(yè)務(wù)、復(fù)雜查詢、跑批業(yè)務(wù)等,被迫通過(guò)系統(tǒng)拆分的方式來(lái)滿足多業(yè)務(wù)訴求。
總體而言,從總體擁有成本(TCO)角度,分布式數(shù)據(jù)庫(kù)的硬件、基礎(chǔ)設(shè)施資源和運(yùn)維成本均高于集中式架構(gòu)。硬件方面,以滿足省級(jí)金融單位要求為例,集中式架構(gòu)災(zāi)備僅需四到六臺(tái)機(jī)柜,而同等規(guī)模分布式需數(shù)十倍的服務(wù)器,也導(dǎo)致網(wǎng)絡(luò)設(shè)備、機(jī)房與電力成本激增;技能要求和人力成本方面,由于需要學(xué)習(xí)全新的技術(shù)棧,將會(huì)要求高技能團(tuán)隊(duì)和持續(xù)的運(yùn)維人力。
基于開(kāi)源二次開(kāi)發(fā)的產(chǎn)品雖能短期滿足外圍系統(tǒng)需求,但受限于內(nèi)核能力,難以在金融等核心場(chǎng)景規(guī)模替代,并不是解決我國(guó)安全可控的可行技術(shù)路線。另一方面,國(guó)產(chǎn)數(shù)據(jù)庫(kù)寄希望于分布式技術(shù)路線彎道超車,而分布式架構(gòu)也并非“銀彈”。
共享集群為金融關(guān)鍵系統(tǒng)提供規(guī)?;娲窂?/strong>
如何去比較好的解決上述提到的痛點(diǎn)呢?吳良智指出,我們是希望能夠通過(guò)“1:1平替Oracle”的方式去實(shí)現(xiàn)規(guī)?;瘡?fù)制。這里說(shuō)的“平替”是指“平滑替換”,是兼容性、功能、性能、高可用、運(yùn)維的全面平滑替換,而不僅僅是兼容和功能的平滑替換,更不是很多人理解的“平價(jià)替換”。這有根本的區(qū)別,因?yàn)楹笳吆苋菀鬃尶蛻粝热霝橹鳟a(chǎn)生低價(jià)替換的認(rèn)知。
針對(duì)金融關(guān)鍵業(yè)務(wù)系統(tǒng)規(guī)?;娲耐袋c(diǎn),崖山主要從三個(gè)方向考慮:一是架構(gòu)、應(yīng)用和運(yùn)維層面提供對(duì)等的能力和體驗(yàn);二是面向關(guān)鍵業(yè)務(wù)系統(tǒng)的產(chǎn)品能力打磨,在性能和可用可靠性上滿足嚴(yán)苛要求;三是安全可靠能力做扎實(shí)。
首先是架構(gòu)、應(yīng)用、運(yùn)維“三不變”。這直接決定能否實(shí)現(xiàn)規(guī)模化、低成本、無(wú)痛式的平滑替換。
在架構(gòu)層面,崖山共享集群采用了自研的技術(shù)路線,除了自研事務(wù)引擎設(shè)計(jì)、MVCC、表索引存儲(chǔ)等內(nèi)核技術(shù),同時(shí)原創(chuàng)了聚合內(nèi)存技術(shù)、集群文件系統(tǒng)、集群管理服務(wù)等共享集群關(guān)鍵技術(shù),實(shí)現(xiàn)了與Oracle RAC的架構(gòu)對(duì)等設(shè)計(jì)。
在應(yīng)用層面,崖山共享集群產(chǎn)品提供面向應(yīng)用無(wú)狀態(tài)的計(jì)算擴(kuò)展能力,其透明多寫(xiě)多讀特性讓用戶如同使用集中式系統(tǒng)般簡(jiǎn)單便捷。此外,YashanDB的核心突破在于對(duì)PL/SQL存儲(chǔ)過(guò)程、自定義函數(shù)、包等高級(jí)特性的全面兼容。吳良智指出,僅實(shí)現(xiàn)語(yǔ)法兼容尚不足夠,語(yǔ)義兼容機(jī)制確保了結(jié)果正確性,而完善的PL/SQL支持則意味著極低的遷移代價(jià)。YashanDB通過(guò)全向深度兼容,確保替換過(guò)程中上層應(yīng)用代碼基本無(wú)需改造,實(shí)現(xiàn)真正的業(yè)務(wù)無(wú)感式遷移。
最后是在運(yùn)維層面,崖山數(shù)據(jù)庫(kù)提供從技術(shù)兼容、智能工具到知識(shí)賦能的完整解決方案,如DBA熟悉的Oracle運(yùn)維利器如Hint/Outline、AWR報(bào)告、yasrman (類比RMAN)、exp/imp、FlashBack等均得到支持,Oracle DBA 技能實(shí)現(xiàn)平遷,大幅降低原有技術(shù)團(tuán)隊(duì)學(xué)習(xí)曲線和運(yùn)維切換成本。
其次是做到“性能、可用可靠性兩對(duì)等”。
性能決定了方案能否支撐核心業(yè)務(wù),并直接影響替代成本。在性能方面,YashanDB原創(chuàng)性地采用細(xì)粒度多版本并發(fā)管理機(jī)制、自適應(yīng)異步事務(wù)調(diào)度、全局資源運(yùn)行時(shí)調(diào)度、去中心化事務(wù)管理等技術(shù),突破分布式數(shù)據(jù)庫(kù)硬件依賴瓶頸,在TPC-C測(cè)試中,其4節(jié)點(diǎn)集群性能達(dá)618萬(wàn)tpmC,單節(jié)點(diǎn)擴(kuò)展比超70%,這意味著每秒可以承載數(shù)千筆交易,可滿足大多數(shù)金融機(jī)構(gòu)關(guān)鍵系統(tǒng)的業(yè)務(wù)處理要求。
核心替換對(duì)業(yè)務(wù)連續(xù)性提出極致要求。崖山數(shù)據(jù)庫(kù)可用可靠性對(duì)標(biāo)國(guó)際標(biāo)準(zhǔn),依托“主備共享集群”及“兩地三中心”方案,在確保集群級(jí)高可用的前提下,實(shí)現(xiàn)機(jī)房級(jí)故障、區(qū)域級(jí)故障的無(wú)損容災(zāi),達(dá)成業(yè)務(wù)零中斷與數(shù)據(jù)零丟失,故障恢復(fù)時(shí)間(RTO)與數(shù)據(jù)恢復(fù)點(diǎn)(RPO)均達(dá)到行業(yè)頂尖水平。
最后是打造“安全性更優(yōu)”的自主可控方案。YashanDB選擇全棧自研技術(shù)路線,從零構(gòu)建第一行代碼,保障技術(shù)的自主可控與可持續(xù)演進(jìn);產(chǎn)品取得網(wǎng)絡(luò)關(guān)鍵設(shè)備和網(wǎng)絡(luò)安全專用產(chǎn)品安全認(rèn)證、商用密碼產(chǎn)品認(rèn)證、IT產(chǎn)品信息安全認(rèn)證EAL4增強(qiáng)級(jí)(EAL4+)、等保三級(jí)認(rèn)證等安全認(rèn)證,構(gòu)建起包含100項(xiàng)以上安全防護(hù)機(jī)制的全方位防御體系。
吳良智認(rèn)為,目前,關(guān)鍵業(yè)務(wù)系統(tǒng)替代更多還是國(guó)有大行等大企業(yè)先行嘗試,中小企業(yè)還不敢貿(mào)然在核心系統(tǒng)替換上邁出太大的步子。只有規(guī)模平替,才能讓中小企業(yè)在高端場(chǎng)景也用得起、用得上、用得好數(shù)據(jù)庫(kù)。崖山共享集群在綜合成本(TCO)方面的顯著優(yōu)勢(shì),成為破解這一局面的關(guān)鍵突破口。以共享集群為核心的解決方案,憑借“1:1替代”技術(shù)路徑,打破了傳統(tǒng)國(guó)產(chǎn)化方案依賴“業(yè)務(wù)重構(gòu)與高額改造成本”的困局,從應(yīng)用改造、軟硬件投入、基礎(chǔ)設(shè)施資源消耗到服務(wù)支出實(shí)現(xiàn)全面降本,至少釋放50%以上的成本,讓更多的資源可以投入到業(yè)務(wù)創(chuàng)新。
在某城商行A類核心系統(tǒng)替換項(xiàng)目中,崖山共享集群實(shí)現(xiàn)了從Oracle RAC的零代碼遷移且性能不降級(jí)。遷移方面,兩個(gè)核心系統(tǒng)僅修改一行代碼,兩周內(nèi)完成全量數(shù)據(jù)遷移與驗(yàn)證;性能方面,上線后各業(yè)務(wù)模塊響應(yīng)時(shí)間與Oracle環(huán)境完全持平,滿足實(shí)時(shí)支付與清算需求。
“金融關(guān)鍵業(yè)務(wù)系統(tǒng)的國(guó)產(chǎn)化替代,絕非簡(jiǎn)單的‘換馬甲’,而是要在性能、生態(tài)、安全上實(shí)現(xiàn)對(duì)等替換甚至超越?!眳橇贾强偨Y(jié)道。深算院以打造中國(guó)原創(chuàng)的基礎(chǔ)軟件品牌為使命,投入數(shù)百人研發(fā)團(tuán)隊(duì),在共享集群這一數(shù)據(jù)庫(kù)技術(shù)皇冠上取得突破。YashanDB崖山共享集群的推出及應(yīng)用,標(biāo)志著國(guó)產(chǎn)數(shù)據(jù)庫(kù)正式跨越了“可用”階段,大步邁入“好用”時(shí)代。
隨著金融業(yè)進(jìn)入關(guān)鍵業(yè)務(wù)系統(tǒng)規(guī)?;娲A段,崖山共享集群以其獨(dú)特的“三不變、兩對(duì)等、一更優(yōu)”能力和顯著的TCO優(yōu)勢(shì),為行業(yè)提供了一條可復(fù)制、可驗(yàn)證、可落地的規(guī)?;娲窂?。