數(shù)據(jù)中心能效指標分析與實踐 |
發(fā)布時間: 2012/9/10 18:38:32 |
數(shù)據(jù)中心能效指標分析與實踐IT設備、提到能源效率通常有一個概念就是每瓦特能帶來多少的性能。這兩個概念對于數(shù)據(jù)中心來說,是可以統(tǒng)一起來的。衡量一個數(shù)據(jù)中心的能效,數(shù)0一個最直接的指標就是數(shù)據(jù)中心輸出到IT設備的電能、電力,因為只有這些電力,才能真正決定IT設備、IT系統(tǒng)能做多少事情,這就是數(shù)據(jù)中心的性能。 了解數(shù)據(jù)中心的能效在管理學上,有一個戴明環(huán)的概念,從質(zhì)量管理或者說是管理理論來說,如果不去測量就沒法管理、沒法控制。數(shù)據(jù)中心也是這樣的,首先就是要去度量,到底能源效率是什么?而度量就需要指標。 關于PUE,簡單地說幾點,第一點是Power和energy的關系,一般來說Power這個詞是指功率,它的單位是瓦特或者千瓦,energy是一個千瓦時的概念,就是用了多少度的電。PUE這個詞更準確一點應該叫EUE,但是Power這個詞也是一直用下去了,但是在實際測量的時候,建議連續(xù)測量千瓦時,就是測量energy這個指標,作為一個平均PUE的度量,它比瞬時的要準確得多。 第二個是整體PUE和局部PUE,所有數(shù)據(jù)中心從供電局出來的電,高壓變電站出來的電,都作為一個整體的耗電,比上最終IT設備的耗電,是一個整體PUE,但是有一些單個機房的,我們可以算一些局部PUE,就是只算這一小部分的輸入電量和輸出的IT電量的一個比值,后面也會有一個在我們自己的實驗室的一個局部PUE的結(jié)果,局部PUE通常會優(yōu)于整體PUE,比如一些集裝箱,它的PUE是1.03,但是只是它局部的,整體的可能是1.2. 第三個是IT設備的耗電測量點,其實可以有很多種,如果為了簡單,可以在UPS這端來測量,但是它會包含一部分線損,精確的會在服務器的輸入端來測量,不同的測量點的PUE值是稍微有一點差別的,但是不會影響特別大。 既然這個公式這樣計算,我的IT設備的耗電越高,買那些更費電的設備,是不是PUE越低?數(shù)據(jù)中心總耗電這個分子不是一個常量,不是一個定值,它是隨著IT設備的耗電來變化的。用一個很粗略的方式分析一下?偤碾娍梢韵喈斢贗T設備的耗電加制冷系統(tǒng)的耗電,加供電系統(tǒng)的損耗,這是一個約等于的關系,而制冷的耗電,其實是一個制冷量跟制冷系統(tǒng)本身能效比的比值,制冷量又跟IT設備的耗電有關。供電系統(tǒng)的損耗,可以按照這個公式算,同樣也跟IT設備耗電有關,最終比下來你會發(fā)現(xiàn),PUE里面IT設備耗電找不著了,比如變成了一些制冷設備的能效、供電設備的轉(zhuǎn)化效率,或者一些其他環(huán)境的消耗等方面,是成為影響PUE的因素。 但是隨著PUE的記錄被不斷地刷新,以美國為例,PUE現(xiàn)在平均在1.8、1.9左右,國內(nèi)可能在2.0到2.5之間,但是現(xiàn)在有很多數(shù)據(jù)中心已經(jīng)到1.07、1.06、1.05這個水平了,隨著這個記錄不斷地被刷新,降低PUE是不是真的等于省電?這似乎是一個沒有意義的問題,它確實是省電,因為如果IT設備的耗電不變的情況下,降低PUE,數(shù)據(jù)中心總耗電會降低,它肯定會省電。 其次當PUE比較低的時候,例如已經(jīng)降到1.2的時候,供電和制冷系統(tǒng)再降低50%的能耗(這是很不容易做到的事情了),對于整個數(shù)據(jù)中心節(jié)能的效果,僅僅相當于IT設備降低10%的能耗、耗電,而IT設備降低10%能耗這個目標,我相信在座的很多數(shù)據(jù)中心或者做IT設備的專家都認為不是太難的一個指標。 其次是IT設備的能效,最有名的就是能效比,也解決每瓦特的性能,接下來這個指標SWaP,除了功率和性能之外,把空間占用也考慮進去了,這個指標應該是SUN最早提出來的,然后能耗負載比又把這個IT設備的利用率也考慮進去了,SPUE是針對現(xiàn)在的這個整機柜的方案,把機架的電力和服務器的電力做一個比值,這個指標SPUE現(xiàn)在騰訊主要在推,當然我們還有一些其他跟節(jié)能相關的指標,比如功率密度、環(huán)境溫度、待機功耗等等。可以看到,其實數(shù)據(jù)中心的能效指標已經(jīng)開始向IT設備擴展,其實這也從另外一個側(cè)面反映了數(shù)據(jù)中心的基礎設施跟IT設備的協(xié)同設計和優(yōu)化的趨勢。 在服務器的能耗管理,經(jīng)過大量的測試,比如對不同的服務器的功耗進行監(jiān)測,第一個是通過服務器自身傳感器報告的功耗和功率計測得的精確的功耗,做一個比較,發(fā)現(xiàn)這個誤差對于不同的服務器的還是差別非常大的,最多的達到將近8%的差距。 另外我們發(fā)現(xiàn),服務器即使在關機的情況下,甚至最高有到20瓦的耗電,服務器的閑置功耗跟滿載功耗的一個比值,最高可以達到66%,就是說這個服務器在什么都沒做的情況下,可能消耗了三分之二的最大的電能。這些數(shù)據(jù)都是沒有測試之前有些是沒有想到的。 總結(jié)3點,第一,PUE是很重要的指標,但不是能效的全部,,另外就是不同的能效指標,可能要根據(jù)測量的條件或者管理的需求來選擇,中國移動目前也在積極開展相關的數(shù)據(jù)中心的能效的一種測試和評估,也希望跟在座的業(yè)界的各位做一些交流。 數(shù)據(jù)中心節(jié)能應該說為中國移動的節(jié)能目標作出了重要的貢獻,比如切切實實的單位業(yè)務量是比這5年降低了50%. 本文出自:億恩科技【1tcdy.com】 |