避免IT運(yùn)維敗筆不當(dāng)事后諸葛亮 |
發(fā)布時(shí)間: 2012/5/20 17:18:38 |
隨著每一個(gè)企業(yè)信息化水平的不斷提升,業(yè)務(wù)系統(tǒng)對(duì)網(wǎng)絡(luò)的依賴日趨加深,而其中的運(yùn)維管理問題,尤其是主動(dòng)運(yùn)維的難題日益突出,看似輕微的網(wǎng)絡(luò)故障很有可能威脅到整個(gè)公司的運(yùn)作。對(duì)此,傳統(tǒng)的故障管理模式顯得力不從心,公司的IT部門如果只是從報(bào)修電話中體現(xiàn)價(jià)值,總是做事后諸葛亮是很危險(xiǎn)的。這是因?yàn)镮T部門的價(jià)值將會(huì)在"修"中逐漸被公司淡忘。那么,如何才能實(shí)現(xiàn)"變事后管理為事前管理"呢?
在IT中,救火隊(duì)員無法成為"英雄"
《Ladder49》,中文名為《云梯49》的電影是美國911事件催生的碩果,其中的內(nèi)容不能不讓觀眾聯(lián)想到兩座世貿(mào)大廈倒塌時(shí)有多少紐約的救火隊(duì)員喪生其中。不論是手握水龍頭,還是之后的搜救任務(wù),正如影片中隊(duì)長肯尼迪說的一樣:"我們的任務(wù)僅僅是被動(dòng)的安全。"不論是電影中,還是我們?cè)谏钪行纬傻牡赖略u(píng)判,救火隊(duì)員在我們的心中一直以英雄的位置所占據(jù)。但在IT運(yùn)維的場景中,如果一名企業(yè)的網(wǎng)絡(luò)管理員被扣上"救火隊(duì)員"的帽子,那么這為網(wǎng)絡(luò)管理員或其部門可能就顯得不那么體面了。
作為國內(nèi)領(lǐng)先的IT運(yùn)維產(chǎn)品和服務(wù)提供商,北塔軟件在電力、政府、金融、電信等4000家用戶的IT運(yùn)維系統(tǒng)部署中聆聽到了很多用戶的聲音。在這其中,許多之前未部署IT運(yùn)維產(chǎn)品的"簡單網(wǎng)絡(luò)"常會(huì)出現(xiàn)勇猛的救火隊(duì)員。但隨著企業(yè)對(duì)于網(wǎng)絡(luò)了依賴程度越來越高,規(guī)模越來越大,一些企業(yè)的網(wǎng)絡(luò)部門反映救火隊(duì)員的日子并不好過:"當(dāng)?shù)谝淮谓拥綀?bào)修電話的時(shí)候,用戶還是對(duì)我們非常客氣,而逐漸的,第2次,第3次之后,我們就能感覺到抱怨的情緒在電話中開始體現(xiàn)出來。而在公司的會(huì)議上,領(lǐng)導(dǎo)對(duì)IT部門也逐漸失去了信任感,因?yàn)闃I(yè)務(wù)部門總會(huì)以系統(tǒng)故障,或是網(wǎng)絡(luò)緩慢為由'起訴'我們。"經(jīng)過分析,我們不難發(fā)現(xiàn),造成IT部門如此尷尬的原因,還是因?yàn)橹鲃?dòng)運(yùn)維的模式未能落實(shí)。當(dāng)網(wǎng)絡(luò)運(yùn)維管理已經(jīng)上升到一個(gè)全面、綜合的階段,將不僅僅局限于對(duì)于網(wǎng)絡(luò)、設(shè)備的"修",因?yàn)閱渭兊?quot;修",對(duì)于效率第一的業(yè)務(wù)部門說仍然是受損的。用戶所需要的網(wǎng)絡(luò)是不出現(xiàn)問題,無故障、無延遲,因此即使在故障發(fā)生之后能做一個(gè)舌辯群儒的諸葛亮,在公司其他部門的眼中,IT部門此時(shí)所有的努力仍然屬于狡辯或是推脫責(zé)任的范疇。
變事后管理為事前管理的四個(gè)條件
核心業(yè)務(wù)和IT系統(tǒng)息息相關(guān),一旦網(wǎng)絡(luò)出現(xiàn)了故障,影響和損失非常巨大。所以,傳統(tǒng)的管理模式只能導(dǎo)致"出現(xiàn)問題后被動(dòng)響應(yīng)",而這種解決問題的效率和質(zhì)量相當(dāng)于事后諸葛亮,雖然可以減少損失,但無法避免損失。因此,針對(duì)主動(dòng)運(yùn)維的落實(shí),北塔軟件的技術(shù)部總經(jīng)理魏玉雄先生認(rèn)為:"IT運(yùn)維應(yīng)隨需應(yīng)變,滿足企業(yè)現(xiàn)在和未來的成長。主動(dòng)運(yùn)維要落實(shí),在運(yùn)維中就要做到四個(gè)字,這就是'看、監(jiān)、析、查'。"
看得見:無法知道IT系統(tǒng)中的每個(gè)關(guān)鍵應(yīng)用承載設(shè)備在哪里,甚至不知道這些設(shè)備連接的應(yīng)用在哪個(gè)端口上,此時(shí)的IT管理就等于盲人摸象。這會(huì)導(dǎo)致管理人員無法及時(shí)發(fā)現(xiàn)問題,更加無法迅速定位故障,各關(guān)鍵應(yīng)用、業(yè)務(wù)系統(tǒng)、辦公系統(tǒng)、財(cái)務(wù)系統(tǒng)等的運(yùn)行也無法得到保障。如果看不見,我們就無法對(duì)底層物理網(wǎng)絡(luò)的結(jié)構(gòu)和瓶頸獲取信息,所以后面所有的步驟也就是成了空談?吹靡娛堑谝徊剑热,企業(yè)如果使用了北塔的BTNM,則可以利用多種算法,迅速搜索整個(gè)網(wǎng)絡(luò)內(nèi)的所有節(jié)點(diǎn),一旦這些多個(gè)廠商的設(shè)備被我們囊獲,那么就可以實(shí)現(xiàn)整個(gè)網(wǎng)絡(luò)的真實(shí)物理拓?fù)鋱D,實(shí)時(shí)反映出整個(gè)網(wǎng)絡(luò)的運(yùn)行狀態(tài)。
監(jiān)得到:只能看到設(shè)備是無用的,只有實(shí)現(xiàn)底層監(jiān)控平臺(tái),通過監(jiān)控IT基礎(chǔ)設(shè)備發(fā)現(xiàn)故障并預(yù)警,才能讓運(yùn)維人員脫離以往"救火隊(duì)員"的角色。用戶可以為在拓?fù)鋱D中為每條設(shè)備或連接加以注釋,為每臺(tái)設(shè)備設(shè)置中文名稱或是業(yè)務(wù)組編號(hào)。通過采集系統(tǒng)負(fù)載狀況和設(shè)備屬性,以及線路的實(shí)時(shí)流量,通過顏色顯示負(fù)載和流量的壓力,主動(dòng)告訴用戶關(guān)注點(diǎn)應(yīng)在哪里,動(dòng)態(tài)告訴用戶可能的故障隱患。此時(shí),IT部門就可以把這些對(duì)象控制起來,設(shè)置多級(jí)的預(yù)警閥值,將可能出現(xiàn)的故障在它們未爆發(fā)之前就形成主動(dòng)關(guān)注。
析得清:在這個(gè)監(jiān)控平臺(tái)上,下一步的操作就是按告警事件種類、告警事件源、密集告警時(shí)間段等分類生成報(bào)表。當(dāng)然,這并非數(shù)據(jù)的堆砌,而是經(jīng)過整理的統(tǒng)計(jì)和分析,有結(jié)果的分析管理。比如,我們可以通過之前記錄的故障排除步驟和與故障相關(guān)的值班員日志,構(gòu)造排錯(cuò)行動(dòng)記錄,將"事件、故障、日志"三者構(gòu)成邏輯上相互關(guān)聯(lián)的整體,以反映故障產(chǎn)生、變化、消除的整個(gè)過程的各個(gè)方面。
查得勤:此時(shí),由于網(wǎng)絡(luò)管理員已經(jīng)可以使用BTNM實(shí)時(shí)監(jiān)視網(wǎng)內(nèi)所有設(shè)備的各個(gè)端口、CPU、內(nèi)存,既可以通過傳統(tǒng)的設(shè)置閾值的方式來判斷異常,也可以通過對(duì)歷史數(shù)據(jù)的智能分析,及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)設(shè)備的異常波動(dòng)。因此,IT運(yùn)維工作實(shí)際上已經(jīng)進(jìn)入到一個(gè)"習(xí)慣性"的操作場景中。一旦發(fā)現(xiàn)異常情況,我們就可以通過BTNM提供的多種手段和工具,通過事件和數(shù)據(jù)的關(guān)聯(lián)性及一致性,幫助用戶分析可能出現(xiàn)的故障。到達(dá)此階段之后,普通的監(jiān)控人員完全可以根據(jù)自動(dòng)的流程,使用系統(tǒng)自帶或配合第三方程序的聯(lián)動(dòng)設(shè)置,實(shí)現(xiàn)故障前的處理操作。
經(jīng)過廣泛的調(diào)查,我們發(fā)現(xiàn)在一些企業(yè)中,IT運(yùn)維人員大多是多重身份,他可能既是管理者又是具體執(zhí)行者,不可能24小時(shí)緊盯監(jiān)控頁面,實(shí)時(shí)對(duì)所有運(yùn)行監(jiān)控參數(shù)進(jìn)行分析。所以,他們需要的IT管理軟件如果能提供智能分析,幫信息管理人員及時(shí)預(yù)警故障隱患,才算是真正起到作用。因此,要實(shí)現(xiàn)主動(dòng)運(yùn)維的目標(biāo),實(shí)際上就是IT運(yùn)維產(chǎn)品以足夠的廣度去采集充足的信息,而這些信息的加工、分析、控制也是缺一不可的。而北塔軟件正式以這樣一種廣度和深度,突破了基礎(chǔ)設(shè)施運(yùn)維監(jiān)控的瓶頸,真正滿足了企業(yè)用戶對(duì)主動(dòng)運(yùn)維的訴求。 本文出自:億恩科技【1tcdy.com】 服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |