系統(tǒng)運(yùn)維秘訣:變化,監(jiān)控,擴(kuò)展(技術(shù)篇)(1) |
發(fā)布時(shí)間: 2012/5/28 10:18:11 |
編者按:本文是SixApart的MySQL DBA,Dormando在2008年總結(jié)的一套運(yùn)維秘訣。編者前日看到Google系統(tǒng)管理員Tom Limoncelli在Everything Sysadmin上推薦這篇文章,并表示這篇文章的內(nèi)容在今天仍然適用。閱讀之下,發(fā)現(xiàn)的確是篇難得的好文章,有大量的經(jīng)驗(yàn)分享總結(jié),F(xiàn)在51CTO系統(tǒng)頻道特將本文全文翻譯過(guò)來(lái),當(dāng)作給各位運(yùn)維讀者們的2011新年禮物。 51CTO推薦專(zhuān)題:系統(tǒng)運(yùn)維秘訣 完全理解本文內(nèi)容需要一定的運(yùn)維經(jīng)驗(yàn)。您可能對(duì)這些文章也會(huì)感興趣: 以下為正文。 在運(yùn)維管理的過(guò)程中,我發(fā)現(xiàn)了很多有價(jià)值的秘訣,本文是這些秘訣的一個(gè)總結(jié)。雖然這些秘訣可能比較“唯心”,但是我還是把它們總結(jié)出來(lái)了,相信它們會(huì)對(duì)你有幫助的。 Dormando的運(yùn)維秘訣分成以下三大篇: 下面先從技術(shù)篇開(kāi)始。交流篇和實(shí)踐篇會(huì)陸續(xù)整理放出。 技術(shù)篇為變化而設(shè)計(jì) ◆Google的秘訣是正確的——“為變化而設(shè)計(jì)”。“變化”就是不得不部署新的軟件,升級(jí)現(xiàn)有的軟件,進(jìn)行擴(kuò)展,設(shè)備損壞,以及人員流動(dòng)等。 ◆每一件事情都是在尋找平衡點(diǎn)。你也許會(huì)認(rèn)為把你的系統(tǒng)和某個(gè)操作系統(tǒng)或某個(gè)Linux發(fā)行版牢牢地綁定在一起是一個(gè)好主意,但事實(shí)上這跟把它們完全隔離一樣糟。如果實(shí)在有必要,你可以進(jìn)行分層,并使用一點(diǎn)間接性。 ◆這并不意味著你的系統(tǒng)必須是平臺(tái)無(wú)關(guān)的。其實(shí)我們的目的很簡(jiǎn)單:一變二,二變二十,一個(gè)系統(tǒng)必須可以應(yīng)對(duì)各種突發(fā)事件。也就是說(shuō),如果一個(gè)系統(tǒng)管理員被公共汽車(chē)撞了,你有應(yīng)對(duì)的方案!如果掛載的硬盤(pán)出現(xiàn)故障了,你有應(yīng)對(duì)的方案!如果某些人運(yùn)行了rm -rf /,你也有應(yīng)對(duì)的方案!增量的進(jìn)行變更。記得安全更新,以及保持內(nèi)容更新。 使用自動(dòng)的,可重復(fù)的構(gòu)建過(guò)程 ◆不要手動(dòng)構(gòu)建任何東西。如果你一定需要手動(dòng)構(gòu)建,那么就做兩遍,在做第二遍的時(shí)候把用到所有的命令都提取出來(lái)。 ◆下面這一點(diǎn)十分重要:將新硬件上線到生產(chǎn)環(huán)境的過(guò)程不應(yīng)該超過(guò)15分鐘,而且這個(gè)過(guò)程必須足夠簡(jiǎn)單。否則,當(dāng)一個(gè)服務(wù)器出現(xiàn)故障,而沒(méi)有人知道如何更換它的時(shí)候,你就該倒霉了。 ◆下面這一條是普世真理:這個(gè)世界上不存在“一次性”的服務(wù)器構(gòu)建。即使你的服務(wù)器只需要構(gòu)建一次,但只要你構(gòu)建過(guò)一次,就一定會(huì)有第二次。比如,當(dāng)它損壞的時(shí)候,或者你必須進(jìn)行一次重大的升級(jí)才能讓它在在接下來(lái)的兩年時(shí)間里更加穩(wěn)定的時(shí)候。 ◆測(cè)試,檢查新構(gòu)建好的服務(wù)器。這應(yīng)該是比較容易的,因?yàn)槟愕臉?gòu)建過(guò)程都是自動(dòng)化的,對(duì)吧! ◆腳本化的構(gòu)建,意味著從某個(gè)Linux發(fā)行版的V3升級(jí)到V4應(yīng)該是很快的。安裝 使用冗余 ◆容易重新構(gòu)建,并不意味著你可以忽視冗余。跳轉(zhuǎn)盒,郵件服務(wù)器,計(jì)費(fèi)網(wǎng)關(guān),等等。如果其中的一半掛掉了卻并不造成客戶(hù)的宕機(jī),生活將會(huì)變得更加簡(jiǎn)單。 ◆按照以上方針來(lái)做的話,當(dāng)某個(gè)設(shè)備在凌晨3點(diǎn)出現(xiàn)故障的時(shí)候,你可以“以后再處理那個(gè)出現(xiàn)故障的設(shè)備!”,把冗余的機(jī)器先替換上去。 ◆下面這一條是個(gè)聊勝于無(wú)的解決方案:Rsync。DRBD也許也不是一個(gè)完美的解決方案,但是它可以提供令人稱(chēng)奇的服務(wù)。(參考閱讀:DRBD筆記,DRBD實(shí)例1,DRBD實(shí)例2) 使用備份 ◆備份是個(gè)嚴(yán)肅的話題。使用硬盤(pán),燒錄磁帶。壓縮它們,移動(dòng)它們,并行地運(yùn)行。對(duì)每一樣?xùn)|西進(jìn)行備份! ◆如果你的構(gòu)建過(guò)程是自動(dòng)的,整個(gè)過(guò)程都可以被備份。如果到目前為止的幾條你都做到了,那么一個(gè)真正的“災(zāi)難恢復(fù)”計(jì)劃也許并不是那么遙不可及的。 本文出自:億恩科技【1tcdy.com】 服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |