升級原生云運維能力,構(gòu)建金融級應(yīng)用PaaS平臺

近年來,金融業(yè)務(wù)發(fā)展的日益線上化和數(shù)字化,不僅加大了對IT基礎(chǔ)資源以及業(yè)務(wù)系統(tǒng)的運維監(jiān)控需求,同時還增加了對高可用管理能力的客觀訴求。

●  架構(gòu)升級:在云架構(gòu)和微服務(wù)架構(gòu)轉(zhuǎn)型過程中,需要有完善的業(yè)務(wù)連續(xù)性保障方案和方法論體系來保駕護航。

● DevOps轉(zhuǎn)型:在DevOps轉(zhuǎn)型過程中,需要有平臺來緊密的結(jié)合應(yīng)用研發(fā),應(yīng)用運維,以及平臺運維的工作,共同建設(shè)保障體系。

● 日常運維:在日常運維保障工作中,需要有自動化的工具平臺將知識沉淀成平臺能力,做到持續(xù)能力提升。

因此,升級原生云運維能力,構(gòu)建金融級應(yīng)用PaaS平臺是金融機構(gòu)數(shù)字化轉(zhuǎn)型過程中的必然選擇。螞蟻為了具備高效、安全、智能的系統(tǒng)運維能力,提高運維效率和保障系統(tǒng)穩(wěn)定,基于運維平臺化、數(shù)據(jù)化的設(shè)計理念,集合大數(shù)據(jù)計算和云計算的能力,形成了可控的金融級運維能力。其中包括金融安全風(fēng)險控制能力、金融級業(yè)務(wù)全鏈路管理能力等,并整體上形成了螞蟻金融級應(yīng)用PaaS-高可用管理解決方案。

目前,螞蟻金融級應(yīng)用PaaS-高可用管理解決方案可對系統(tǒng)運維風(fēng)險的事前事中事后進行全方位控制管理。

● 事前:通過流程化的日常業(yè)務(wù)巡檢、故障演練、業(yè)務(wù)監(jiān)控,建立風(fēng)險發(fā)現(xiàn)的手段和體系,主動發(fā)現(xiàn)風(fēng)險。

● 事中:當(dāng)風(fēng)險事件發(fā)生時,通過應(yīng)急管理快速拉起應(yīng)急流程,完成故障快速診斷、通過應(yīng)急預(yù)案、容災(zāi)切換實現(xiàn)故障快速恢復(fù)。

● 事后:通過風(fēng)險管理回溯、復(fù)盤等機制,加固風(fēng)險事件發(fā)現(xiàn)和診斷能力,不斷提供業(yè)務(wù)高可用水平。

圖片2.png

六大核心能力,保證系統(tǒng)穩(wěn)定和安全

螞蟻金融級應(yīng)用 PaaS 平臺將大規(guī)模金融級運維能力與漸進式的云原生架構(gòu)轉(zhuǎn)型方案相結(jié)合,打造了滿足金融場景需求的大規(guī)模容器運維管控能力。

風(fēng)險管理平臺

● 技術(shù)風(fēng)險平臺風(fēng)險水平的總覽,集中演示了數(shù)據(jù)中心運行水位、關(guān)鍵節(jié)點、應(yīng)用水位,以及巡檢、應(yīng)急、診斷、演練等各個模塊當(dāng)前狀態(tài),能夠幫助用戶總體掌握站點技術(shù)風(fēng)險情況。

日常巡檢平臺,技術(shù)風(fēng)險高可用域的核心能力,通過豐富的插件能力,為用戶自動巡檢能力。具備以下3個用戶價值:

● 自動化,巡檢任務(wù)自動執(zhí)行,無需人工干預(yù),將原本小時級的巡檢任務(wù)縮減到分鐘級。

● 對象豐富,支持SOFAStack中應(yīng)用、容器、虛擬機、數(shù)據(jù)庫、物理服務(wù)器等資源巡檢。

● 結(jié)果可視化,通過圖形化報表將巡檢任務(wù)和風(fēng)險直接展示,支持導(dǎo)出便于存檔。

故障診斷平臺,技術(shù)風(fēng)險故障排查模塊,通過預(yù)設(shè)的檢查邏輯,在故障發(fā)生時可以直接執(zhí)行快速定位問題根因。

● 專家經(jīng)驗沉淀,已知問題的診斷過程,可以通過診斷平臺進行有效沉淀。

● 縮短故障定位時間,通過診斷任務(wù),將標(biāo)準(zhǔn)診斷動作自動執(zhí)行,有效縮短故障定位時間。

故障演練平臺

● 故障注入到應(yīng)急預(yù)案進行完整編排,最終各環(huán)節(jié)制定情況以報告方式呈現(xiàn)。

應(yīng)急預(yù)案平臺

● 針對不同的風(fēng)險場景,提前指定好應(yīng)急預(yù)案,當(dāng)風(fēng)險發(fā)生時,自動(或手動)觸發(fā)預(yù)案,故障快速恢復(fù);通過預(yù)案編排能力,特定風(fēng)險場景下的應(yīng)急動作,在風(fēng)險發(fā)生時,執(zhí)行預(yù)案。

容災(zāi)大盤圖形化展示雙機房容災(zāi)架構(gòu),并實時監(jiān)控存儲、數(shù)據(jù)庫、PaaS、應(yīng)用等容災(zāi)核心組件的當(dāng)前狀態(tài),并監(jiān)控雙機房入口流量。

賦能金融機構(gòu),共建金融級云原生應(yīng)用PaaS生態(tài)圈

伴隨著螞蟻在數(shù)字金融領(lǐng)域的探索,在十多年的發(fā)展過程中,技術(shù)團隊積累了大量的架構(gòu)設(shè)計原則、最佳實踐和產(chǎn)品服務(wù)案例。螞蟻致力于構(gòu)筑一個完整的金融級云原生架構(gòu),通過成熟的中間件和架構(gòu)運維平臺,使上層的應(yīng)用能專注業(yè)務(wù)邏輯并具備敏捷交付的能力,又使其天然擁有金融級的高可用、一致性特性和互聯(lián)網(wǎng)的海量并發(fā)、彈性伸縮等云原生基礎(chǔ)架構(gòu)能力。

據(jù)介紹,螞蟻完全自主研發(fā)的金融級分布式架構(gòu)SOFAStack,就是構(gòu)建金融級云原生架構(gòu)的應(yīng)用平臺,沉淀了金融場景的最佳實踐,提供服務(wù)構(gòu)建、應(yīng)用開發(fā)、部署發(fā)布、服務(wù)治理、監(jiān)控運維、容災(zāi)高可用等全棧式解決方案,兼容Dubbo、Spring Cloud等微服務(wù)運行環(huán)境,助力客戶各類應(yīng)用輕松轉(zhuǎn)型分布式架構(gòu)。如今SOFAStack已經(jīng)在包括中國人保、南京銀行、浙商證券、上海華瑞銀行、四川農(nóng)信銀行等數(shù)十家金融機構(gòu)落地應(yīng)用。

以四川農(nóng)信為例,作為首期國家發(fā)改委的數(shù)字化轉(zhuǎn)型伙伴行動的金融機構(gòu),在過去兩年里,四川農(nóng)信借助阿里金融云平臺、SOFAStack金融分布式架構(gòu)、mPaaS技術(shù)框架、數(shù)據(jù)中臺等技術(shù)支撐,推動其IT架構(gòu)由集中式向分布式的架構(gòu)轉(zhuǎn)型,重構(gòu)的手機銀行互金平臺,也實現(xiàn)了平臺系統(tǒng)操作的敏捷性由天變成小時甚至可以達到秒級。

事實上,本次云棲大會發(fā)布的金融級應(yīng)用PaaS-高可用管理解決方案,就是SOFAStack金融分布式架構(gòu)產(chǎn)品中的一部分,在螞蟻內(nèi)部也被稱為“守夜人”,可以幫助運維同學(xué)提前發(fā)現(xiàn)業(yè)務(wù)風(fēng)險,并快速處理風(fēng)險,實現(xiàn)減時增效的目標(biāo),從而保證業(yè)務(wù)系統(tǒng)的穩(wěn)定運行。

現(xiàn)在,螞蟻把自己在金融級PaaS運維領(lǐng)域的多年實踐經(jīng)驗和知識體系沉淀形成這套技術(shù)管理模式,并將其對外進行產(chǎn)品化、商業(yè)化輸出,希望能夠支持更多金融機構(gòu)也能夠在互聯(lián)網(wǎng)金融業(yè)務(wù)場景下快速復(fù)制云原生的架構(gòu)能力并為業(yè)務(wù)創(chuàng)造價值,與行業(yè)共同推動架構(gòu)轉(zhuǎn)型升級與數(shù)字金融創(chuàng)新,共建金融級云原生的應(yīng)用PaaS生態(tài)圈。

分享到

zhangnn

相關(guān)推薦