子鉃 發(fā)表于:14年06月09日 16:28 [轉(zhuǎn)載] 賽迪網(wǎng)
盡管網(wǎng)絡基礎設施的穩(wěn)定性越來越高、IT運維概念不斷推陳出新,但事實上,還有眾多的網(wǎng)絡工程師并沒有從日常維護工作中得到真正意義上的解脫。而作為被動運維管理的典型,“電話報修”這種傳統(tǒng)模式必須要得以徹底改變,才能將網(wǎng)絡工程師丟失的時間、精力和效率找回來,才能從在主動服務中將IT運維管理的真正價值釋放出來。
某大型電網(wǎng)公司網(wǎng)絡信息中心,每天接到的報修電話數(shù)量超過百個,由于長期處于高壓狀態(tài),很多工程師都對電話鈴聲極其反感,有的人甚至懷疑自己患上了“電話恐懼癥”。如果從心理學角度上分析,這種莫名的恐懼,是一種容易治療的疾病。但若從技術和管理角度上分析,則是整個IT運維系統(tǒng)出現(xiàn)了問題,電話另一頭許多的“未知”是讓工程師產(chǎn)生不安的“病根”。
作為國內(nèi)領先的IT運維管理專家,北塔軟件認為:只有具備主動事前管理+故障判斷功能的運維解決方案,才能幫助用戶徹底擺脫“電話報修”這種被動運維模式。網(wǎng)絡架構(gòu)就如同人體構(gòu)造一樣復雜,造成網(wǎng)絡故障的原因也是多種多樣。一方面,用戶在電話中的描述很難準確;另一方面,網(wǎng)絡工程師采用手工檢測、經(jīng)驗判斷,一般也就能解決“通斷”之類的故障,對用戶端實際情況也很難判斷出真正原因。
那么,IT運維人員通過何種途徑能夠?qū)崿F(xiàn)“事前管理“?針對本文中的案例來看,首要任務就是解決設備層面的監(jiān)控和預警難題。信息網(wǎng)絡中心需要把鏈路、網(wǎng)絡設備、服務器等納入一個平臺上進行管理,提供7X24小時全天候監(jiān)控。
對此,我們通過分析北塔軟件IT運維綜合管理解決方案可以看出端倪。首先,通過涵蓋網(wǎng)絡、應用、故障、資產(chǎn)等方面一體化管理平臺,徹底消除企業(yè)IT管理中的盲點,從而解決“被動運維”給企業(yè)造成的效率不高、服務水平低陷的問題。利用北塔軟件的自動拓撲發(fā)現(xiàn)功能,可以幫助管理員對所管理的設備類型進行分類,并對設備所涉及到的參數(shù)進行實時監(jiān)控。同時,該方案還可以通過靈活多樣的告警方式,主動告知運維人員當前遇到的問題和原因,這便消除了電話中許多的“未知”因素,從而在全局和細節(jié)上都能實現(xiàn)主動運維。
其次,在故障發(fā)現(xiàn)方面,基于ICMP的管理,只能對服務器和網(wǎng)絡設備的連通性進行簡單性測試,但在業(yè)務逐漸復雜的后續(xù)階段就顯得力不從心了。不難看出,北塔軟件在解決方案中采用了以“路徑”為核心的故障分析方法,包含了化解故障復雜性的“故障根源分析策略”、TFS管理系統(tǒng)、業(yè)務流量視圖等等。
針對“路徑”的具體應用,北塔軟件表示:不論多么復雜的系統(tǒng),都有數(shù)據(jù)行走的路線。而通過日常高頻度監(jiān)測少量關鍵指標,控制被管系統(tǒng)承載壓力,一旦發(fā)現(xiàn)問題,便能依據(jù)業(yè)務系統(tǒng)實際的流量路徑,逐層擴大數(shù)據(jù)采集的深度和廣度,層層深入,這樣就可直達故障的根源。
恐懼的原因是缺乏自信,而作為支持企業(yè)實現(xiàn)從設備管理跨越到業(yè)務管理的運維平臺,IT綜合管理解決方案中許多功能可以消除“未知”,從而讓IT運維管理重獲自信。另外,該方案還包含了“業(yè)務視圖”、“自動巡檢”和“業(yè)務仿真”等更高級的運維“助手”,不但可以改善被動運維的局面,還可以站在用戶的角度實現(xiàn)網(wǎng)絡應用體驗。例如:設定完成“業(yè)務仿真”的流程和平均訪問時間閾值之后,北塔BTIM將模擬業(yè)務與運維人員自動執(zhí)行登錄、模擬處理常規(guī)業(yè)務流程、搜尋業(yè)務系統(tǒng)故障、嘗試自動修復等操作步驟。而這些創(chuàng)新應用的引入,都是確保IT部門在電話鈴聲響起前,便能提前發(fā)現(xiàn)問題,讓主動服務輕松實現(xiàn)。
如此,網(wǎng)絡工程師遠離電話鈴聲已經(jīng)不是問題,而所有故障處理也不必再憑借“假設推斷”和“個人經(jīng)驗”來排除。主動運維格局的形成,不但具有了從運維怪圈跳出的彈力,更可以在日后的創(chuàng)新應用中擁有持續(xù)優(yōu)化的能力,從而更好地將IT與業(yè)務相融合,促進業(yè)務的快速發(fā)展。