高效虛擬化策略實(shí)現(xiàn)私有云的性能監(jiān)控 |
發(fā)布時(shí)間: 2012/8/10 16:23:33 |
私有云性能監(jiān)控非常重要,不僅能診斷故障,而且確保服務(wù)級(jí)別滿足集中化服務(wù)所需。為保證成功,聰明的IT人員經(jīng)常創(chuàng)建高效率的虛擬化策略來完成私有云的性能監(jiān)控。
持續(xù)收集私有云性能監(jiān)控?cái)?shù)據(jù) 私有云主要是關(guān)于流程、自動(dòng)化、人員管理和整合集中等內(nèi)容。一些私有云使用虛擬化技術(shù)和物理宿主機(jī),所以無論采用哪種工具完成性能監(jiān)控,您需要收集來自于各種宿主機(jī)的數(shù)據(jù)。持續(xù)地收集數(shù)據(jù)而不是僅在整合、集中或故障診斷時(shí)才去做。 通常,用戶和監(jiān)控系統(tǒng)在問題剛剛產(chǎn)生時(shí)不會(huì)察覺。只有當(dāng)問題變得嚴(yán)重足以影響到用戶使用后才被發(fā)現(xiàn)。通過歷史數(shù)據(jù),您可以看到問題產(chǎn)生的時(shí)間。或許CPU負(fù)載的問題在一周前的病毒掃描程序升級(jí)完成后就產(chǎn)生了。您可以在歷史數(shù)據(jù)中輕松發(fā)現(xiàn)這點(diǎn),幫助解決問題的人員快速地定位、修復(fù)和恢復(fù)到高效狀態(tài)。 私有云性能監(jiān)控還帶來一些非技術(shù)性收益。您希望集中的一些服務(wù),例如各部門的Web服務(wù)器通常不會(huì)設(shè)置很多的監(jiān)控。當(dāng)服務(wù)宕機(jī)或變慢時(shí),很多部門的做法是簡(jiǎn)單重啟。而這種做法是錯(cuò)誤的。 如果您推動(dòng)集中服務(wù)的理由是通過監(jiān)控提高可用性和性能,那么各部門很難拒絕。畢竟,您做了正確的事情,而他們沒有。 透明化 透明化也很重要。把云性能數(shù)據(jù)開放給開發(fā)人員和應(yīng)用管理員,這樣他們可以看到自己所做配置選擇對(duì)性能的影響。對(duì)基于虛擬化架構(gòu)的云而言,類似的一些選擇可能對(duì)應(yīng)用本身是有益的,但卻影響到整個(gè)環(huán)境的性能。IT系統(tǒng)也講究平衡,包括性能在內(nèi)。某個(gè)應(yīng)用的性能目標(biāo)應(yīng)該用文檔記錄,這樣可以盡力去達(dá)到而不是超出。超出這些目標(biāo)需要額外的資金和時(shí)間投入。 選擇相關(guān)聯(lián)的數(shù)據(jù)采集點(diǎn)對(duì)私有云性能進(jìn)行監(jiān)控 當(dāng)部署私有云性能監(jiān)控系統(tǒng)時(shí),盡可能多地從正確的地點(diǎn)收集相關(guān)聯(lián)維度的數(shù)據(jù)。不要從虛擬化環(huán)境中某臺(tái)虛擬機(jī)中獲取關(guān)于CPU負(fù)載的信息,結(jié)果會(huì)是錯(cuò)誤的。您應(yīng)該從虛擬化平臺(tái)角度去獲取準(zhǔn)確數(shù)據(jù)。同樣,內(nèi)存使用率、網(wǎng)絡(luò)I/O、存儲(chǔ)I/O等等也是這樣。 相反,應(yīng)用性能最好從單個(gè)服務(wù)器的級(jí)別上判斷,可以幫助識(shí)別某個(gè)集群成員是否已超負(fù)荷。 另外,盡可能地以最小粒度收集數(shù)據(jù)。很多性能監(jiān)控工具以5、15或60分鐘的平均數(shù)據(jù)作為歷史數(shù)據(jù),這體現(xiàn)到圖形上就使得峰值數(shù)據(jù)變得平緩。這種平緩帶來一些假象,因?yàn)榉逯禂?shù)據(jù)意義重大。 當(dāng)應(yīng)用響應(yīng)工作時(shí),不是慢慢地進(jìn)行,而是調(diào)用所有它可用的CPU資源盡可能快速地完成,在圖形上體現(xiàn)為100%的CPU使用率峰值。峰值時(shí)間的長(zhǎng)度非常重要,這通常代表最終用戶對(duì)應(yīng)用快慢的感受。換句話說,是請(qǐng)求和結(jié)果之間的延遲時(shí)間。 如果性能監(jiān)控軟件把這些峰值跟空閑時(shí)間進(jìn)行了平均,可能看到的是50%的CPU使用率,從而得到錯(cuò)誤的結(jié)論認(rèn)為性能可以滿足。網(wǎng)絡(luò)和存儲(chǔ)連接的工作方式類似。假設(shè)某一分鐘100%的使用率,而下一分鐘為0%,那么平均使用率為50%,看起來不是什么問題。這種情況下通過高解析度軟件進(jìn)行深入分析很有必要。當(dāng)然保留大量的數(shù)據(jù)和收集高精度數(shù)據(jù)的過程也會(huì)消耗CPU、內(nèi)存、網(wǎng)絡(luò)和存儲(chǔ)資源,所以您需要找到平衡點(diǎn)。 本文出自:億恩科技【1tcdy.com】 服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |