數(shù)據(jù)中心的管理日益復(fù)雜,時(shí)刻都有龐大而復(fù)雜的數(shù)據(jù)信息需要處理,各種各樣的因素隨時(shí)有可能導(dǎo)致突發(fā)性事故的發(fā)生,而造成的損失也是驚人的。這些復(fù)雜的因素很難通過直觀的方式分析和理解,機(jī)器學(xué)習(xí)的介入有一定的必然性。Google數(shù)據(jù)中心副總裁Joe Kava告訴我們采用神經(jīng)網(wǎng)絡(luò)可以“預(yù)見”數(shù)據(jù)中心的“未來”,從而為數(shù)據(jù)中心的工程師們提供最優(yōu)的方案,Google具體是怎樣做的?
數(shù)據(jù)中心的管理日益復(fù)雜,時(shí)刻都有龐大而復(fù)雜的數(shù)據(jù)信息需要處理,各種各樣的因素隨時(shí)有可能導(dǎo)致突發(fā)性事故的發(fā)生,而造成的損失也是驚人的。這些復(fù)雜的因素很難通過直觀的方式分析和理解,機(jī)器學(xué)習(xí)的介入有一定的必然性。Google數(shù)據(jù)中心副總裁Joe Kava告訴我們采用神經(jīng)網(wǎng)絡(luò)可以“預(yù)見”數(shù)據(jù)中心的“未來”,從而為數(shù)據(jù)中心的工程師們提供最優(yōu)的方案,Google具體是怎樣做的?
Google將機(jī)器學(xué)習(xí)和人工智能應(yīng)用到強(qiáng)大的數(shù)據(jù)中心,致力于讓數(shù)據(jù)中心更高效。近日,在Data Centers Europe 2014的一份簡(jiǎn)報(bào)中,Google的數(shù)據(jù)中心副總裁Joe Kava告訴我們Google已經(jīng)采用神經(jīng)網(wǎng)絡(luò)來分析數(shù)據(jù),該神經(jīng)網(wǎng)絡(luò)系統(tǒng)可以收集服務(wù)器群的相關(guān)信息,并提供改進(jìn)方案。
實(shí)際上,谷歌已經(jīng)制造出了一臺(tái)超級(jí)計(jì)算機(jī),這臺(tái)計(jì)算機(jī)比谷歌的工程師們更了解數(shù)據(jù)中心。目前,數(shù)據(jù)中心仍然由人工控制,但Joe Kava告訴我們,神經(jīng)網(wǎng)絡(luò)的使用將使Google服務(wù)器群的效率達(dá)到一個(gè)全新的高度,這甚至讓制造它的工程師們望塵莫及。
谷歌已經(jīng)擁有了多個(gè)高效的數(shù)據(jù)中心,使用人工智能后,Google將能夠預(yù)見“未來”,通過模擬出數(shù)以千計(jì)的可能情況,了解到未來數(shù)據(jù)中心的運(yùn)行狀況。
在早期,神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)谷歌電力使用效率的準(zhǔn)確率已經(jīng)達(dá)到99.6%.這種方法帶來的效率提升看起來很小,但當(dāng)其應(yīng)用到具有數(shù)千個(gè)服務(wù)器的數(shù)據(jù)中心時(shí),就可以節(jié)約下大量的成本。
為什么要采用機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)?主要的原因是數(shù)據(jù)中心日益復(fù)雜,這對(duì)谷歌來說是個(gè)挑戰(zhàn),Google利用傳感器從數(shù)以億計(jì)的數(shù)據(jù)點(diǎn)收集有關(guān)其基礎(chǔ)設(shè)施及能源使用狀況的信息。
谷歌的神經(jīng)網(wǎng)絡(luò)是由Jim Gao創(chuàng)建的,由于他對(duì)大型數(shù)據(jù)集有很強(qiáng)的分析能力,他的同事給他取了個(gè)綽號(hào)——“天才小子(Boy Genius)”。Gao應(yīng)用計(jì)算流體動(dòng)力學(xué)來做冷卻分析,利用監(jiān)測(cè)數(shù)據(jù)創(chuàng)建了一個(gè)服務(wù)器房間里的氣流3D模型。
Gao認(rèn)為創(chuàng)建一個(gè)模型來跟蹤一組廣泛的變量是有可能實(shí)現(xiàn)的,這些變量包括IT負(fù)載、天氣條件,以及冷卻塔、水泵和換熱器(這些設(shè)備用來給谷歌服務(wù)器降溫)的運(yùn)作情況。
Kava在一篇博客中寫道:“計(jì)算機(jī)擅長(zhǎng)的是在數(shù)據(jù)中發(fā)現(xiàn)隱含的信息,所以Jim采用了我們?nèi)粘2僮鬟^程中收集的數(shù)據(jù),并將這些數(shù)據(jù)放到一個(gè)模型中運(yùn)行,目的是理解普通人(Jim的團(tuán)隊(duì))可能注意不到的復(fù)雜互動(dòng)的意義,如今Jim的模型在預(yù)測(cè)PUE(Power Usage Effectiveness,電源使用效率)時(shí)的準(zhǔn)確率已經(jīng)達(dá)到了99.6%。這意味著他可以使用該模型提出新方案,從我們的操作中獲得更高的效率?!?
Gao倡導(dǎo)發(fā)展和使用機(jī)器學(xué)習(xí),并將其稱之為“20 percent project”,谷歌鼓勵(lì)員工在特定工作職責(zé)之外花大量時(shí)間進(jìn)行創(chuàng)新。Gao原先并不是人工智能方面的專家,為了了解更多有關(guān)機(jī)器學(xué)習(xí)的知識(shí),他學(xué)習(xí)了斯坦福大學(xué)Andrew Ng教授的課程。
神經(jīng)網(wǎng)絡(luò)模仿人類大腦的工作原理,讓計(jì)算機(jī)在沒有顯式編程的情況下,自動(dòng)適應(yīng)和“學(xué)習(xí)”。谷歌的搜索引擎往往被看作是這類機(jī)器學(xué)習(xí)的典型,這也是該公司主要研究的一個(gè)重點(diǎn)。
Kava解釋說:“該模型實(shí)際上就是一系列的微分方程,你需要對(duì)數(shù)學(xué)有所了解,該模型能夠了解這些變量之間的交互?!?
Gao的第一項(xiàng)任務(wù)是研究數(shù)字,標(biāo)識(shí)出影響Google數(shù)據(jù)中心能源效率的重要因素,以PUE為標(biāo)準(zhǔn)。他將這些因素縮小到19個(gè)變量,然后設(shè)計(jì)了神經(jīng)網(wǎng)絡(luò),即一個(gè)可以分析大型數(shù)據(jù)集以識(shí)別模式的機(jī)器學(xué)習(xí)系統(tǒng)。
Gao在他的倡議白皮書中寫道:“大量可能的設(shè)備組合以及它們的設(shè)定值使最優(yōu)效率難以確定,在數(shù)據(jù)中心,通過硬件(機(jī)械和電氣設(shè)備)和軟件(控制策略和設(shè)定值)有許多可能的組合。受到時(shí)間既定、IT負(fù)載頻繁波動(dòng)和天氣狀況的限制下,測(cè)試每一種可能組合以實(shí)現(xiàn)效率最大化是不可行的,更不用說還要維持一個(gè)穩(wěn)定的DC環(huán)境。
說到硬件,實(shí)際上機(jī)器學(xué)習(xí)不需要多么強(qiáng)的計(jì)算能力,Kava告訴我們,該機(jī)器學(xué)習(xí)系統(tǒng)在單個(gè)服務(wù)器上就可以運(yùn)行,甚至可以運(yùn)行在高端臺(tái)式機(jī)上。
該系統(tǒng)已經(jīng)被應(yīng)用到Google數(shù)據(jù)中心,該機(jī)器學(xué)習(xí)工具能夠提供建議,對(duì)PUE進(jìn)行改進(jìn);或者在能源設(shè)施升級(jí)過程中,對(duì)數(shù)據(jù)中心負(fù)載遷移的改進(jìn);也可以對(duì)冷卻系統(tǒng)中多個(gè)部分的水溫調(diào)整。
Gao還寫道:“谷歌(數(shù)據(jù)中心)的實(shí)際測(cè)試表明,機(jī)器學(xué)習(xí)是使用現(xiàn)有傳感器為DC能源效率建模的一種有效方法,可以顯著地節(jié)約成本?!?
Kava告訴我們:“該工具可以幫助谷歌對(duì)未來設(shè)計(jì)進(jìn)行模擬和完善,但我們不需要擔(dān)心機(jī)器奪走人類的控制權(quán)——近期,Google的數(shù)據(jù)中心還不太可能擁有自我意識(shí)。雖然Google熱衷于實(shí)現(xiàn)自動(dòng)化,最近又收購(gòu)了多家機(jī)器人公司,但新的機(jī)器學(xué)習(xí)工具目前還不可能控制一個(gè)數(shù)據(jù)中心?!?
Kava說:“數(shù)據(jù)中心仍然需要人類對(duì)許多事務(wù)作出良好的判斷,我仍然希望我們的工程師對(duì)機(jī)器提供的建議進(jìn)行審查?!?
從Google構(gòu)建服務(wù)器群的方式中,我們或許可以看到神經(jīng)網(wǎng)絡(luò)帶來的好處。Kava說:“我可以想象出在數(shù)據(jù)中心的設(shè)計(jì)周期中使用神經(jīng)網(wǎng)絡(luò)的情形,我們可以將它作為一個(gè)具有前瞻性的工具使用,用來測(cè)試設(shè)計(jì)的變化和創(chuàng)新,將來我們會(huì)找到更多的用例。”
Google在Gao的白皮書中分享了機(jī)器學(xué)習(xí)的方法,期待其他超大規(guī)模數(shù)據(jù)中心的運(yùn)營(yíng)商也能開發(fā)類似的工具。
Kava說:“這不是只有Google或者Jim Gao才能做到的事情,我很樂意看到這類分析工具被更加廣泛的使用。我認(rèn)為這個(gè)行業(yè)可以從這類工具中受益,它是一個(gè)可以提供效率的好工具。”
河南億恩科技股份有限公司(1tcdy.com)始創(chuàng)于2000年,專注服務(wù)器托管租用,是國(guó)家工信部認(rèn)定的綜合電信服務(wù)運(yùn)營(yíng)商。億恩為近五十萬的用戶提供服務(wù)器托管、服務(wù)器租用、機(jī)柜租用、云服務(wù)器、網(wǎng)站建設(shè)、網(wǎng)站托管等網(wǎng)絡(luò)基礎(chǔ)服務(wù),另有網(wǎng)總管、名片俠網(wǎng)絡(luò)推廣服務(wù),使得客戶不斷的獲得更大的收益。
服務(wù)器/云主機(jī) 24小時(shí)售后服務(wù)電話:
0371-60135900
虛擬主機(jī)/智能建站 24小時(shí)售后服務(wù)電話:
0371-55621053
網(wǎng)絡(luò)版權(quán)侵權(quán)舉報(bào)電話:
0371-60135995
服務(wù)熱線:
0371-60135900