- 相關(guān)推薦
企業(yè)運(yùn)維系統(tǒng)建立初探
【摘要】隨著IT技術(shù)在企業(yè)的應(yīng)用,很多企業(yè)已經(jīng)建立了核心業(yè)務(wù)系統(tǒng),企業(yè)的運(yùn)作已經(jīng)離不開IT系統(tǒng)了。如何保障信息系統(tǒng)安全可靠的運(yùn)行已成為企業(yè)最為關(guān)注的題目,而傳統(tǒng)的運(yùn)行維護(hù)治理模式已經(jīng)不能適應(yīng)目前環(huán)境下業(yè)務(wù)的需求。因此對(duì)IT系統(tǒng)需要一套治理系統(tǒng)來支撐,這就是運(yùn)行維護(hù)系統(tǒng)。【關(guān)鍵詞】運(yùn)維系統(tǒng) 運(yùn)維服務(wù) IT技術(shù)
一、背景說明
隨著IT技術(shù)在企業(yè)的應(yīng)用,很多企業(yè)已經(jīng)建立了核心業(yè)務(wù)系統(tǒng),如ERP、OA、數(shù)據(jù)倉庫等,業(yè)務(wù)策略驅(qū)動(dòng)IT策略的建立,IT策略支持業(yè)務(wù)策略,由此,很多企業(yè)的運(yùn)作已經(jīng)離不開IT系統(tǒng)了,因此任何一個(gè)故障造成的損失,影響面是比較大,甚至影響整個(gè)企業(yè)的業(yè)務(wù)。而傳統(tǒng)的運(yùn)行維護(hù)治理模式比較被動(dòng), 即只有當(dāng)系統(tǒng)出題目時(shí), 才會(huì)引起留意和得到解決, 或者當(dāng)業(yè)務(wù)受影響, 并被業(yè)務(wù)部分匯報(bào)投訴,才發(fā)現(xiàn)題目。 這種治理模式已經(jīng)不能適應(yīng)目前環(huán)境下業(yè)務(wù)的需求。
其次,從生命周期的角度看,無論是硬件還是軟件,大致可分為規(guī)劃和設(shè)計(jì)、開發(fā)和測試、實(shí)施、運(yùn)營和終止等5個(gè)階段。前面3階段從時(shí)間的角度看,只占生命周期的20%,其余80%的時(shí)間基本上是運(yùn)維服務(wù),假如整個(gè)IT的運(yùn)維做得不好,那么這些花費(fèi)大筆投資建立起來的系統(tǒng),無法帶來預(yù)期的效益,甚至于無法使用,由于使用者無法順利使用他們。
根據(jù)Gartner Group調(diào)查發(fā)現(xiàn),在經(jīng)常出現(xiàn)的題目中,源自技術(shù)和產(chǎn)品方面的實(shí)在只占了20%,流程失誤占40%,職員疏失占40%。流程失誤包括變更治理沒有做好、超載、沒有測試等流程上的失誤或不完整,職員疏失包括遺忘、練習(xí)不足、備份錯(cuò)誤及安全疏忽等。這就說明IT運(yùn)維方面的題目,更多的不是技術(shù)題目,而是來自治理方面,因此對(duì)IT系統(tǒng)需要一套治理系統(tǒng)來支撐,這就是運(yùn)行維護(hù)系統(tǒng)。
二、信息系統(tǒng)運(yùn)行維護(hù)面臨的挑戰(zhàn)
一般信息系統(tǒng)架構(gòu)的層次如下:
由此,我們可以看到,為了保證應(yīng)用系統(tǒng)的可用性,不但要保證應(yīng)用程序本身的正確性和健壯性,同時(shí)還要保證從網(wǎng)絡(luò)到應(yīng)用程序端到真?zhèn)可用性,為此,從運(yùn)行維護(hù)的角度來看,必須從整體的角度來規(guī)劃,對(duì)與應(yīng)用系統(tǒng)相關(guān)的IT基礎(chǔ)設(shè)施、支撐平臺(tái)進(jìn)行集中監(jiān)控,并與應(yīng)用系統(tǒng)進(jìn)行關(guān)聯(lián),一旦出現(xiàn)故障,可以迅速定位并解決;同時(shí)定義相關(guān)的流程保證一個(gè)應(yīng)用的變更不會(huì)對(duì)其他應(yīng)用產(chǎn)生影響,對(duì)出現(xiàn)的題目從根源上找出原因,并進(jìn)行解決,從而保證系統(tǒng)的高可用性;诒救藢(duì)IT服務(wù)治理的理解,基于ITIL的框架,提出運(yùn)行維護(hù)系統(tǒng)建立的一些想法。
三、運(yùn)行維護(hù)系統(tǒng)的設(shè)計(jì)
那么如何設(shè)計(jì)IT運(yùn)行維護(hù)系統(tǒng)呢?主要從兩方面著手,一是治理流程的設(shè)計(jì),二是系統(tǒng)監(jiān)控的設(shè)計(jì)。在治理流程方面,目前ITIL(IT Infrastruct Library)基本上成為事實(shí)上的標(biāo)準(zhǔn),它是最佳實(shí)踐的結(jié)晶;在系統(tǒng)監(jiān)控方面包括從IT基礎(chǔ)設(shè)施應(yīng)用系統(tǒng)進(jìn)行監(jiān)控,并實(shí)現(xiàn)事件的關(guān)聯(lián),以實(shí)現(xiàn)主動(dòng)的監(jiān)控,實(shí)現(xiàn)故障的快速定位和預(yù)警,下面具體說明。
。ㄒ唬┻\(yùn)維系統(tǒng)的設(shè)計(jì)理念
運(yùn)維系統(tǒng)的設(shè)計(jì)理念基于ITIL-IT服務(wù)治理框架,ITIL 將IT 服務(wù)治理分為:
●信息和通訊基礎(chǔ)框架治理,這部份將更側(cè)重于技術(shù)視角。
●服務(wù)治理,包括“提供IT 服務(wù)” 和“支持IT ”服務(wù)兩部分,關(guān)注在提供IT 服務(wù)過程中,監(jiān)控,治理,處理解決題目的整個(gè)過程。
●面向業(yè)務(wù)的治理,將從業(yè)務(wù)的視角來看治理,將治理IT 服務(wù)與IT 服務(wù)所支撐的業(yè)務(wù)關(guān)聯(lián)。
1. 信息和通訊基礎(chǔ)框架治理
IT 基礎(chǔ)框架的智能治理是服務(wù)保障的基礎(chǔ),應(yīng)該是一個(gè)可以全面治理IT 基礎(chǔ)框架中所有產(chǎn)品和技術(shù)的平臺(tái),并通過提供以下能力達(dá)到真正的業(yè)務(wù)價(jià)值、真正的投資回報(bào)、保障安全生產(chǎn),進(jìn)步服務(wù)水平。
IT 基礎(chǔ)框架的智能治理將覆蓋企業(yè)IT環(huán)境,提供包括廣域網(wǎng),局域網(wǎng),主機(jī)接進(jìn)網(wǎng)絡(luò),網(wǎng)絡(luò)安全設(shè)備,Internet 服務(wù)的全方位的IT 從網(wǎng)絡(luò)到系統(tǒng),應(yīng)用,業(yè)務(wù)的監(jiān)控治理,以及面向IT運(yùn)維的事件壓縮,事件相關(guān)性分析,故障診斷,根源故障分析,自動(dòng)化的故障處理等一系列功能和工具。
2. 服務(wù)治理
今天,正進(jìn)行著服務(wù)治理的革命。幾乎所有企業(yè)的IT 部分都正在向面向業(yè)務(wù)的服務(wù)提供者的轉(zhuǎn)變。IT部分就像一個(gè)合作伙伴一樣參與到企業(yè)的業(yè)務(wù)過程,主動(dòng)的提供服務(wù)職能,并向它的客戶-業(yè)務(wù)部分負(fù)責(zé)。
ITIL 將企業(yè)的IT 服務(wù)治理分為:
提供IT服務(wù),關(guān)注在提供IT 服務(wù)過程中和治理行為和手段;
支持IT 服務(wù), 關(guān)注在支持IT 服務(wù)過程中,處理題目,變更等的動(dòng)作和流程。
。1)提供IT 服務(wù)
提供IT 服務(wù)包括:制定規(guī)劃,為業(yè)務(wù)部分按計(jì)劃和服務(wù)質(zhì)量提供服務(wù)
保障提供服務(wù)的持續(xù)性。
在服務(wù)提供體系實(shí)現(xiàn)的主要任務(wù)是:
■服務(wù)水平治理
■可用性治理
■容量治理
■本錢治理
■應(yīng)急方案
。2)支持IT 服務(wù)
支持IT 服務(wù)包括:為達(dá)到服務(wù)目標(biāo)提供相關(guān)治理信息。為實(shí)現(xiàn)服務(wù)目標(biāo)提供相應(yīng)的支撐機(jī)制。
服務(wù)支持體系實(shí)現(xiàn)的主要任務(wù)是:
■配置治理
■幫助臺(tái)治理
■題目治理
■變更治理
■軟件控制和分發(fā)治理
3. 面向業(yè)務(wù)的治理
面向業(yè)務(wù)的IT 治理是從客戶視角的端到端服務(wù)監(jiān)控治理,它的特點(diǎn)是:
提供直觀的監(jiān)控視圖,能夠?qū)崟r(shí)判定通訊和IT 基礎(chǔ)框架故障對(duì)業(yè)務(wù)的影響;
在發(fā)生影響業(yè)務(wù)的故障時(shí),IT服務(wù)保障部分能夠最快的獲知題目的發(fā)生,并迅速采取行動(dòng);
根據(jù)故障對(duì)業(yè)務(wù)的影響情況,決定處理的優(yōu)先級(jí);
當(dāng)業(yè)務(wù)服務(wù)發(fā)生題目時(shí)能夠確定故障所在的基礎(chǔ)框架層次;
通知相關(guān)客戶服務(wù)系統(tǒng)或大客戶,告知題目的狀況和解決進(jìn)展;
面向客戶業(yè)務(wù)服務(wù),提供基于Web 的多種視圖,包括端到端服務(wù)監(jiān)控層次模型,和監(jiān)控構(gòu)成服務(wù)系統(tǒng)的各個(gè)組件;
面向業(yè)務(wù)治理的宗旨是通過全面的業(yè)務(wù)系統(tǒng)和IT 框架系統(tǒng)監(jiān)控,增強(qiáng)治理,進(jìn)步治理水平,并終極保障業(yè)務(wù)的成功運(yùn)行。實(shí)現(xiàn)IT基礎(chǔ)框架端到真?zhèn)監(jiān)控和與業(yè)務(wù)的關(guān)聯(lián)。
。ǘ┻\(yùn)維系統(tǒng)的設(shè)計(jì)目標(biāo)
●確保IT流程支撐業(yè)務(wù)流程, 整體進(jìn)步業(yè)務(wù)運(yùn)營的質(zhì)量。
●進(jìn)步用戶的滿足度, 提升企業(yè)的社會(huì)效益和經(jīng)濟(jì)效益。
●實(shí)時(shí)實(shí)現(xiàn)對(duì)從IT的基礎(chǔ)架構(gòu)到應(yīng)用系統(tǒng)的端到真?zhèn)運(yùn)行情況進(jìn)行監(jiān)控。
●提供從業(yè)務(wù)角度分析IT基礎(chǔ)設(shè)施(包括系統(tǒng)、網(wǎng)絡(luò)、數(shù)據(jù)庫、應(yīng)用服務(wù)器)的能力。
●建立完善的支持服務(wù)流程和支持模式。
●建立滿足服務(wù)水平要求的服務(wù)水平治理。
。ㄈ┗贗TIL的理念建立規(guī)范的處理流程
在ITIL中要建立很多治理流程,在實(shí)際應(yīng)用中,我覺得至少需要建立下面幾個(gè)流程:
。1)題目治理
建立并應(yīng)用題目處理程序,以實(shí)現(xiàn)對(duì)題目診斷和確定解決題目的方案, 并將解決方案記錄在配置數(shù)據(jù)庫中,針對(duì)服務(wù)水平治理確定并實(shí)現(xiàn)內(nèi)部的題目升級(jí)時(shí)間標(biāo)準(zhǔn)。
(2)資產(chǎn)治理
對(duì)于天天發(fā)生的事件, 題目, 變更處理, 新服務(wù)的配置, 各個(gè)組件的信息,資產(chǎn)治理的職責(zé)就是提供和維護(hù)這些信息, 它是與服務(wù)治理相關(guān)的最重要的任務(wù)之一。
。3)Help Desk治理
擔(dān)當(dāng)服務(wù)中與業(yè)務(wù)部分和客戶的主要接觸點(diǎn)(point-of-contac)。存儲(chǔ)事件, 確定題目嚴(yán)重級(jí)別, 綜合支持團(tuán)隊(duì)的努力, 確保及時(shí)正確地解決題目, 并提供SLA統(tǒng)計(jì), 證實(shí)能夠達(dá)到預(yù)期的服務(wù)級(jí)別。
(4)變更治理
保證清楚的了解變更針對(duì)一個(gè)服務(wù)中任何組件的影響, 并保證對(duì)服務(wù)水平的影響最小, 變更治理包括SLA文檔和服務(wù)目錄的變更, 以及組織變更和針對(duì)軟件和硬件的變更。
。5)故障治理
故障治理的主要目標(biāo)是盡可能快地恢復(fù)服務(wù)至服務(wù)級(jí)別協(xié)議(SLA)要求的水準(zhǔn),盡可能減少故障對(duì)服務(wù)運(yùn)營的不利影響,以確保最好的服務(wù)質(zhì)量和可用性級(jí)別。
(四)運(yùn)維系統(tǒng)的組成
在一般的運(yùn)維系統(tǒng)中,需要一個(gè)大房間,在大房間中分成以下幾個(gè)部分,每個(gè)部分都扮演相應(yīng)的角色:
第一層:大屏幕分別顯示有,基于業(yè)務(wù)的視圖,基于IT基礎(chǔ)架構(gòu)的視圖,基于網(wǎng)絡(luò)的視圖,當(dāng)故障出現(xiàn)時(shí)能夠以特定的顏色顯示出來,同時(shí)可以顯示一些公司需要直觀顯示的數(shù)據(jù)。
第二層:服務(wù)臺(tái)(Help Desk),主要提供:
●接受客戶的請(qǐng)求
●提供客戶使用上的題目咨詢
●提供客戶業(yè)務(wù)咨詢
●記錄并跟蹤故障和客戶意見
●根據(jù)知識(shí)庫,盡快解決題目
●及時(shí)通知客戶其請(qǐng)求確當(dāng)前狀況和最新進(jìn)展
●根據(jù)服務(wù)級(jí)別協(xié)議,初步評(píng)估請(qǐng)求,經(jīng)歷解決它們或安排給一線工程師解決
●對(duì)客戶的故障從提出到驗(yàn)證及終止的整個(gè)過程進(jìn)行治理
●協(xié)調(diào)一線工程師和值班工程師
第三層:一線支持工程師
●根據(jù)提供的監(jiān)控界面迅速定位題目并解決
●對(duì)于臨時(shí)的解決辦法,還要把故障提交給題目處理流程
●根據(jù)服務(wù)級(jí)別,在題目未能及時(shí)解決時(shí)及時(shí)把題目提交給值班經(jīng)理
第四層:值班經(jīng)理個(gè)人
●協(xié)調(diào)技術(shù)專家,根據(jù)服務(wù)協(xié)議的時(shí)間要求,解決題目
●協(xié)調(diào)供給商,根據(jù)維護(hù)協(xié)議要求,解決題目
。ㄎ澹┻\(yùn)維系統(tǒng)的功能設(shè)計(jì)
基于ITIL設(shè)計(jì)理念,我們把ECC的實(shí)時(shí)監(jiān)控部分設(shè)計(jì)成層次架構(gòu),如下圖:
1. 事件采集層
在最基本的層次上,需要從被治理的IT基礎(chǔ)設(shè)施中獲取廣泛的,實(shí)時(shí)的數(shù)據(jù),能夠從網(wǎng)絡(luò)、系統(tǒng)和應(yīng)用層中捕捉、匯聚并處理大量數(shù)據(jù)的能力,我們通常稱之為事件治理。
事件治理是整個(gè)面向服務(wù)治理系統(tǒng)的核心,在數(shù)據(jù)采集階段(包括網(wǎng)絡(luò)、系統(tǒng)和應(yīng)用層)采集的信息,只有經(jīng)過事件治理服務(wù)器,轉(zhuǎn)變?yōu)橥坏母袷,再流進(jìn)智能化的治理層,實(shí)現(xiàn)事件的相關(guān)性分析。
數(shù)據(jù)采集層是整個(gè)治理系統(tǒng)進(jìn)行信息處理和智能化分析的基礎(chǔ),因此需要充分獲得正確、實(shí)時(shí)、完整的治理數(shù)據(jù)。在數(shù)據(jù)采集層,應(yīng)該進(jìn)行原始數(shù)據(jù)的過濾、分類、分級(jí)等預(yù)處理操縱,從中提煉出重要的治理信息。數(shù)據(jù)采集層獲取信息的實(shí)時(shí)和正確性,以及對(duì)原始信息的預(yù)處理能力,將在很大程度上影響整個(gè)治理系統(tǒng)的治理能力和效率。
2.事件處理層
數(shù)據(jù)收集僅僅是實(shí)現(xiàn)業(yè)務(wù)和通訊及IT基礎(chǔ)框架治理的基礎(chǔ),需求最簡單的先決條件。實(shí)現(xiàn)真正的基礎(chǔ)框架智能化意味著能夠從整個(gè)基礎(chǔ)框架產(chǎn)生的大量數(shù)據(jù)中,通過采用一系列先進(jìn)的過濾,事件壓縮,關(guān)聯(lián)和診斷的技術(shù)進(jìn)行處理,抽取治理職員需要關(guān)注的重要信息。好的基礎(chǔ)框架監(jiān)控治理系統(tǒng)能夠?qū)⒕W(wǎng)絡(luò)以至IT系統(tǒng)的專業(yè)化知識(shí)融進(jìn)在治理系統(tǒng)中,根據(jù)基礎(chǔ)框架層各組成資源的特點(diǎn),從原始的治理數(shù)據(jù)中智能分析系統(tǒng)的真實(shí)狀況,判定資源實(shí)際的運(yùn)行狀態(tài),分析故障發(fā)生的根源并提出解決建議,使運(yùn)維職員解決題目更加正確和有效。一般包含以下功能:
。1)事件的存儲(chǔ)
將運(yùn)行維護(hù)數(shù)據(jù)與歷史數(shù)據(jù)分開存儲(chǔ), 以確保治理的效率. 一般治理信息需要保存6個(gè)月甚至更長的數(shù)據(jù), 以進(jìn)行統(tǒng)計(jì)分析和存檔, 而在日常運(yùn)行治理中, 一般只需要查看最近一周甚至更短的信息, 一般采用運(yùn)行數(shù)據(jù)與實(shí)時(shí)數(shù)據(jù)分開存儲(chǔ), 運(yùn)行數(shù)據(jù)采用高速的內(nèi)存數(shù)據(jù)庫保證事件處理的實(shí)時(shí)性, 歷史數(shù)據(jù)采用穩(wěn)定的關(guān)系型數(shù)據(jù)庫保證事件存儲(chǔ)的可靠性和容量,這種結(jié)構(gòu)使事件的處理更加公道。
。2)事件壓縮
IT資源事件中有很多重復(fù)事件, 尤其在系統(tǒng)組件不穩(wěn)定時(shí), 有可能會(huì)產(chǎn)生事件風(fēng)暴。過多的事件會(huì)使治理員的桌面上羅列大量事件條目,治理員無法獲取真正需要關(guān)注的重要事件,因此對(duì)重復(fù)事件進(jìn)行合并使事件條目清楚, 幫助治理員快速找到需要處理的故障是非常重要的。重復(fù)事件壓縮就是這樣的一個(gè)過程: 通過將從下層數(shù)據(jù)源所報(bào)告的相似事件加以匯總,合并成一條事件,該事件的內(nèi)容包含了該事件重復(fù)的次數(shù)以及發(fā)生的起止時(shí)間。
。3)事件自動(dòng)化處理
可以對(duì)各類事件信息進(jìn)行邏輯判定, 并做出相應(yīng)的動(dòng)作, 如及時(shí)刪除不必要的信息、完成不同事件之間的關(guān)聯(lián)、對(duì)嚴(yán)重事件采用明顯的聲音報(bào)警、自動(dòng)升級(jí)警告級(jí)別假如嚴(yán)重事件在一段時(shí)間內(nèi)沒有人響應(yīng)、發(fā)送郵件進(jìn)行自動(dòng)通知等等。
(4)可用性的計(jì)算方法
根據(jù)故障樹分析FTA(Fault Tree Analysis)方法,結(jié)合可用性的計(jì)算方法,來計(jì)算服務(wù)的可用性。
組件可用率的計(jì)算方法:組件可用率 = (AST-DT)/AST*100%
AST——約定服務(wù)時(shí)間(Agreed service time)
DT——在約定時(shí)間內(nèi)的實(shí)際停機(jī)時(shí)間(Actual downtime)
。5)可用性的評(píng)估指標(biāo)
通常我們采用下面幾個(gè)指標(biāo)來對(duì)可用性進(jìn)行評(píng)估:
、倬鶆驘o故障時(shí)間(MTBF-Mean Time Between Falures),它指的是從某次事故修復(fù)到下次事故發(fā)生之間的均勻間隔時(shí)間,又稱為正常運(yùn)營時(shí)間(Uptime),它是用來描述服務(wù)的可靠性。
、诰鶆蛐迯(fù)時(shí)間(MTTR-Mean Time To Repair),它指的是事故發(fā)生到服務(wù)恢復(fù)之間的均勻間隔時(shí)間,又稱為停機(jī)時(shí)間(Downtime),它是用來描述服務(wù)的可維護(hù)性和適用性。
3.業(yè)務(wù)關(guān)聯(lián)層
業(yè)務(wù)影響分析, 基于CFIA等分析法,定義事件和業(yè)務(wù)系統(tǒng)的關(guān)聯(lián)關(guān)系, 自動(dòng)找到故障所影響的業(yè)務(wù)和服務(wù), 并根據(jù)關(guān)聯(lián)結(jié)果創(chuàng)建新的服務(wù)事件報(bào)警。
4.呈現(xiàn)層
提供基于Web方式的監(jiān)控視圖, 可以為不同的治理職員提供不同的監(jiān)控窗口, 以實(shí)時(shí)監(jiān)控相關(guān)的事件信息, 事件窗口可以通過分組顯示不同類型、級(jí)別、源、時(shí)間段內(nèi)的事件信息, 治理員可以一目了然的看到目前是否有事件發(fā)生, 級(jí)別如何, 并對(duì)事件進(jìn)行一系列的處理工作。
5.報(bào)表處理層
各種監(jiān)控信息存儲(chǔ)在關(guān)系數(shù)據(jù)庫中,可以利用報(bào)表工具進(jìn)行信息統(tǒng)計(jì)分析,天生各種格式的報(bào)表。
報(bào)表應(yīng)用可以與實(shí)時(shí)故障監(jiān)視環(huán)境實(shí)現(xiàn)無縫集成,為運(yùn)維提供一種長期的綜合視圖。報(bào)表應(yīng)用幫助治理職員了解其各種基礎(chǔ)設(shè)施在各種不同期間的行為特點(diǎn),從不同設(shè)備、系統(tǒng)和服務(wù)的層次上對(duì)各種基礎(chǔ)架構(gòu)的長期行為特點(diǎn)進(jìn)行查看和分析。
。┻\(yùn)維系統(tǒng)的設(shè)計(jì)要求
1.基于ITIL框架設(shè)計(jì), 結(jié)構(gòu)先進(jìn)
運(yùn)維系統(tǒng)的設(shè)計(jì)要求基于ITIL的框架, ITIL的框架是最佳實(shí)踐的結(jié)晶。
2.可擴(kuò)展性
假如需要一個(gè)新的展示層或者事件關(guān)聯(lián),必須能夠無縫擴(kuò)充或集成到現(xiàn)有的治理框架中。為了保證隨著系統(tǒng)架構(gòu)的延伸擴(kuò)展而產(chǎn)生的越來越多的事件信息的處理性能,在任意一個(gè)層次增加都不會(huì)影響整體框架結(jié)構(gòu)。
3.集成性
集成企業(yè)現(xiàn)有以及未來可能要擴(kuò)充的設(shè)備和治理系統(tǒng)。假如需要增加新的監(jiān)控對(duì)象,則最多只需簡單地增加一個(gè)探針,或增加一個(gè)新的關(guān)聯(lián)層 。
4.集中化
已經(jīng)處理的事件(重復(fù)壓縮和事件關(guān)聯(lián))集中在一個(gè)地方。因此治理員可以共享整個(gè)系統(tǒng)的事件信息。
5.關(guān)聯(lián)
由于事件關(guān)聯(lián)功能在整個(gè)系統(tǒng)治理中是分布的,因此為一個(gè)新服務(wù)增加新的事件關(guān)聯(lián)是非常輕易的。
6.冗余
數(shù)據(jù)顯示層和關(guān)聯(lián)層的設(shè)計(jì)將考慮冗余設(shè)計(jì),當(dāng)任何一個(gè)服務(wù)器失敗,數(shù)據(jù)采集層的探針將會(huì)自動(dòng)切換到另一個(gè)服務(wù)器。
綜上所述,運(yùn)維系統(tǒng)的設(shè)計(jì),主要從兩個(gè)方面來實(shí)現(xiàn),一是治理流程的設(shè)計(jì),二是系統(tǒng)監(jiān)控的設(shè)計(jì),通過上面的描述,我們看到,系統(tǒng)監(jiān)控的作用:當(dāng)系統(tǒng)出現(xiàn)故障時(shí)通過對(duì)系統(tǒng)各個(gè)層面的監(jiān)控以及事件的關(guān)聯(lián),能夠保證快速定位故障,從而快速解決故障,使得故障對(duì)業(yè)務(wù)的影響降到最小,同時(shí)通過對(duì)系統(tǒng)性能的監(jiān)控,進(jìn)行預(yù)警,可以做到防范于未然,防范故障于萌芽狀態(tài),保證系統(tǒng)的可用性;而規(guī)范的治理流程,保證所有的題目在每一個(gè)階段得到有效的處理。
【企業(yè)運(yùn)維系統(tǒng)建立初探】相關(guān)文章:
建立我國個(gè)人破產(chǎn)制度的法律初探03-25
建立實(shí)時(shí)企業(yè)的策略分析03-20
企業(yè)業(yè)績評(píng)價(jià)體系初探03-22
企業(yè)環(huán)境成本管理初探03-20
零售企業(yè)維系顧客忠誠策略研究03-22
如何建立企業(yè)的質(zhì)量方針03-21
企業(yè)推行全面預(yù)算管理初探03-07