經過域名解析階段后,靜態(tài)資源命中CDN后直接返回,無命中時會回源去拉取,動態(tài)請求直接訪問WEB服務,在請求到達四層和七層ELB之前,多數(shù)企業(yè)應用也會選擇WAF來清洗異常流量。
經過ELB后,請求到達業(yè)務應用服務器,業(yè)務實例多為分布式構架,微服務之間相互調用,一般情況下企業(yè)運維人員較多的關注點是應用實例這一層,多為企業(yè)自行開發(fā)的服務。
持久化層當前各CSP提供的中間件不一樣,華為云上用戶使用較多的如分布式緩存,分布式數(shù)據(jù)庫等。由于提供動態(tài)擴容及較高級別的SLA,越來越多的企業(yè)不再需要專業(yè)的DBA,轉而使用云上的服務,開發(fā)上也更加敏捷。
如此多的云服務和各種資源,任何一個環(huán)節(jié)出現(xiàn)問題,都將導致應用KPI異常,用戶體驗下降,進而導致企業(yè)運營受到影響,而每個使用云服務的企業(yè),如果投入大量人力去自建運維系統(tǒng)并且將整個請求的各個環(huán)節(jié)關聯(lián)起來,成本會非常高。因此華為云通過實踐構建了一套立體運維體系,幫助企業(yè)更好的進行一站式運維。下面將為您介紹立體運維定位、架構及特點。
立體運維主要是圍繞應用進行監(jiān)控,一站式完成基礎設施層、應用層及用戶體驗層的監(jiān)控。
參考以上典型云應用架構,將業(yè)務請求路徑上經過的不同資源進行分層,分層如下:
圍繞分層設計不同的專業(yè)運維服務子系統(tǒng),將不同數(shù)據(jù)在不同子系統(tǒng)上串聯(lián)協(xié)同、關聯(lián)分析,構筑一個云上的運維平臺,從而最大化的實現(xiàn)數(shù)據(jù)價值,為運維人員提供一個統(tǒng)一的運維中心,達到一站式立體化運維的目的。綜合立體運維定位及典型云應用分層,立體運維融合了華為云的應用運維服務(AOM)、應用性能管理服務(APM),對虛機、存儲、網(wǎng)絡、數(shù)據(jù)庫及應用等多維度實時監(jiān)控,并通過應用與資源告警關聯(lián)、日志分析、智能閾值、分布式調用追蹤、手機APP異常分析等技術,實現(xiàn)分鐘級問題快速診斷和修復,保障云上應用長穩(wěn)運行。
AOM側重于對云主機、存儲、網(wǎng)絡、WEB容器、Docker、Kubernetes等應用運行環(huán)境及應用狀態(tài)、應用與資源的關聯(lián)關系等內容的深入監(jiān)控并進行集中統(tǒng)一的可視化管理,其架構如下:
APM側重于分布式應用性能分析,擁有強大的分析工具,通過拓撲圖、調用鏈、事務分析可視化地展現(xiàn)應用狀態(tài)、調用過程、用戶對應用的各種操作,快速定位問題和改善性能瓶頸,其架構如下:
立體運維一站式完成基礎設施層、應用層及用戶體驗層的監(jiān)控。它具備以下特點:
通過集群與虛機、虛機與應用、應用與資源統(tǒng)一建模,將集群、虛機、網(wǎng)絡、磁盤、數(shù)據(jù)庫、應用、容器及業(yè)務等上百種指標監(jiān)控起來,并提供各種指標智能關聯(lián)分析,運維人員通過統(tǒng)一的告警入口即可下鉆找到問題根因。
將虛機上的應用、開源組件、系統(tǒng)等日志集中采集起來,通過清洗、實時分析、智能聚類等處理,實現(xiàn)了日志的高性能搜索和業(yè)務分析。同時,支持自定義采集路徑、實時刷新、上下文查看、秒級搜索、日志下載、轉儲等常用功能,滿足日常所需。
應用、服務、實例、資源相關聯(lián),可以直接查看到異常影響范圍。針對應用異常,可以直接查看其指標,通過指標找到原因。針對資源異常,可以查看其資源對象拓撲圖及告警情況等信息來定位原因。
應用拓撲是對應用間調用關系和依賴關系的可視化展示,包括應用狀態(tài)、時延、錯誤、負載、依賴關系等指標,支持數(shù)據(jù)庫、緩存、消息中間件、NOSQL等各類開源組件的情況。同時可以按照時間、服務、事務、top等維度進行篩選查看。在應用拓撲中,針對異常也可直接下鉆查看調用關系,定位異常根因。
調用鏈跟蹤、記錄業(yè)務的調用過程,還原業(yè)務請求在分布式系統(tǒng)中的執(zhí)行軌跡和狀態(tài),可以分鐘識別異常原因。在業(yè)務方法被調用時,可自動捕獲該方法的調用者、詳細的堆棧以及各類參數(shù),幫助開發(fā)人員快速鎖定問題現(xiàn)場。
從運營視角,了解每個業(yè)務的運行狀況,包括交易次數(shù)、時延、錯誤率,并通過調用鏈找到異常代碼,同時可以幫助運營人員了解活動期間的交易體驗情況。
數(shù)據(jù)庫SQL語句異常,可能會引發(fā)業(yè)務超時等問題。在日常運維中,可通過錯誤耗時、響應時間等關鍵指標對數(shù)據(jù)庫進行監(jiān)控,定位出那些執(zhí)行耗時長、效率低、調用出錯的SQL語句,并對其進行分析和優(yōu)化。
通過運維數(shù)據(jù),包括百種指標監(jiān)控、KPI數(shù)據(jù)、調用跟蹤數(shù)據(jù)自動完成故障根因分析。具體原理可分為單維度異常識別、復合事件異常識別、業(yè)務根因分析。
單維度異常識別:根據(jù)歷史指標數(shù)據(jù)動態(tài)生成指標基線,無需人工配置告警閾值。
復合事件異常識別:多維護異常指標因果關聯(lián)分析,識別出根源告警。
業(yè)務根因分析:提取業(yè)務正常與異常時上下文數(shù)據(jù)特征,如資源、參數(shù)、調用結構,通過聚類分析找到問題根因。
5G時代,華為云強大可靠的運維能力將助力互聯(lián)網(wǎng)企業(yè)上云無憂,更能抓住5G紅利,搶先擁抱數(shù)字化和智能化時代。7月2日~8月31日期間,華為云啟動“華為云專蜀月”活動,重點為四川以及西南地區(qū)的客戶上云降低門檻,特別推出了西南節(jié)點ECS S3云主機還提供6折特惠的活動。針對視頻、游戲、移動應用APP三大互聯(lián)網(wǎng)應用場景的特惠包,包括免費視頻加速體驗、全球獨家云手機優(yōu)先購買權、免費高頻云服務體驗等權利。華為云為新老客戶、生態(tài)伙伴及開發(fā)者設計優(yōu)惠政策也誠意滿滿:對于老客戶,華為云最高返券可達50%;對于新客戶,則有機會獲得最高贈2萬元的測試券;開發(fā)者更可獲得微認證限時五折特惠并加返百元大禮;生態(tài)合作伙伴則享受首單5折的優(yōu)惠。