建設(shè)新一代數(shù)據(jù)中心需要經(jīng)驗積累,英特爾、惠普、IBM 等廠商都是這方面的探索者。英特爾在全球范圍內(nèi)設(shè)計和建造了250個數(shù)據(jù)中心,為了驗證計算流體力學(xué)模型的效果及動力、散熱設(shè)計假設(shè), 英特爾還實際建造了部分?jǐn)?shù)據(jù)中心。最新完成建造的T3級、7000平方米的數(shù)據(jù)中心具備可以支持超過5千瓦/平方米耗能的能力??芍^高密度數(shù)據(jù)中心的典范。
惠普、IBM則在數(shù)據(jù)中心整合方面卓有成效,惠普到2008年底,將把全球85個數(shù)據(jù)中心整合為6個,集中到美國3座城市;IBM通過少量主機(jī)也取代了數(shù)千臺分布式服務(wù)器。新一代數(shù)據(jù)中心的建設(shè)實際上已經(jīng)有樣板可以遵循,只是視應(yīng)用環(huán)境和實際條件不同,在實現(xiàn)的方式和路徑上有所不同。
應(yīng)該考慮什么
構(gòu)建數(shù)據(jù)中心應(yīng)該注意的要素很多,尤其是對于新建的用戶而言,比如應(yīng)用需求既應(yīng)該滿足當(dāng)前需求,又要考慮到未來的靈活擴(kuò)展,包括功能區(qū)的布局,都需要有長遠(yuǎn)規(guī)劃;從能源與空間的角度考慮,機(jī)房選址不僅要考慮交通、防火,還要考慮對周圍生態(tài)環(huán)境的影響,如果能因地制宜、充分利用能源,如自然制冷或臨近能源附近,甚至采用太陽能供電等,就可以大大節(jié)約成本,提高收益,而改造成本也只需要幾年就可以收回;機(jī)房應(yīng)該采取節(jié)能技術(shù),注重綠色能源利用,增強(qiáng)管理能力,保持業(yè)務(wù)連續(xù)性和高可靠性等。
而對于需要優(yōu)化數(shù)據(jù)中心的用戶來說,他們有哪些經(jīng)驗應(yīng)該參考呢?英特爾就擁有著大量數(shù)據(jù)中心的建設(shè)經(jīng)驗。英特爾IT咨詢服務(wù)歐洲亞洲大區(qū)資深總監(jiān)游錫京告訴記者,62%的英特爾數(shù)據(jù)中心已服役10年以上,也面臨著數(shù)據(jù)存儲、成本、效率、散熱、業(yè)務(wù)需求等挑戰(zhàn),這曾一度導(dǎo)致英特爾的服務(wù)器容量增長相當(dāng)于行業(yè)平均值的5倍, 但資源的有效利用率卻明顯下降。
為此, 英特爾的 IT專家利用先進(jìn)的處理器技術(shù)和IT應(yīng)用經(jīng)驗, 在實踐中總結(jié)出了優(yōu)化數(shù)據(jù)中心的幾項建議。
首先是合并, 合并包括建設(shè)戰(zhàn)略節(jié)點數(shù)據(jù)中心和數(shù)據(jù)中心合并兩項內(nèi)容。英特爾對數(shù)據(jù)中心分層管理,最高一層就是戰(zhàn)略節(jié)點數(shù)據(jù)中心??紤]到業(yè)務(wù)連續(xù)性和災(zāi)難恢復(fù)的需要,英特爾在不同的核心區(qū)域都建設(shè)了兩個以上的戰(zhàn)略節(jié)點數(shù)據(jù)中心,這些數(shù)據(jù)中心擁有強(qiáng)大的計算資源,一些類似于大型程序運行這樣的工作,未必要在本地數(shù)據(jù)中心進(jìn)行, 可以運行在戰(zhàn)略節(jié)點數(shù)據(jù)中心,這樣就實現(xiàn)了計算資源的相對集中。
其次是模塊化設(shè)計, 這是對于數(shù)據(jù)中心合并而言的。 由于早期的數(shù)據(jù)中心將制冷、機(jī)房、供電等設(shè)備都設(shè)計在一起,導(dǎo)致后來需求增長時,卻因為空間和設(shè)計指標(biāo)所限, 根本無法擴(kuò)容。
模塊化設(shè)計則是把數(shù)據(jù)中心按照不同設(shè)備的功能分別建設(shè)在不同的建筑里。按需求,只需要增加如機(jī)房、供電室等模塊就可以實現(xiàn)擴(kuò)展。 英特爾認(rèn)為, 現(xiàn)代數(shù)據(jù)中心應(yīng)由具有高效能和散熱設(shè)計的模塊構(gòu)成,這樣利于數(shù)據(jù)中心的擴(kuò)展和合并。
再次是虛擬化和優(yōu)化,通過數(shù)據(jù)中心在虛擬Linux集群上無縫執(zhí)行設(shè)計計算負(fù)載, 英特爾提高了有效的節(jié)點資源利用率。 這一嘗試讓英特爾在2006年就嘗到了甜頭,虛擬化威力驚人,英特爾當(dāng)年就獲得了2億美元的凈現(xiàn)值回報;同時,用于設(shè)計計算的55%、66%服務(wù)器資源,也從此前的 提升到了 。
優(yōu)化則是為了求得最佳能效比, 數(shù)據(jù)中心追求的就是高性能兼顧降耗和散熱。數(shù)據(jù)中心本身以及數(shù)據(jù)中心之間,都存在著進(jìn)一步優(yōu)化的可能。 例如:多核設(shè)計采用的低能耗酷睿微架構(gòu),相比前代產(chǎn)品可減少40%的能耗;技術(shù)革新也加速了服務(wù)器的更新?lián)Q代,設(shè)備更新帶來的正投資回報率在英特爾數(shù)據(jù)中心已經(jīng)得到證實。
六大技術(shù)要素
從業(yè)務(wù)視角來看,下一代數(shù)據(jù)中心應(yīng)該是以IT服務(wù)供應(yīng)鏈的方式提供服務(wù)的,它包括基礎(chǔ)設(shè)施、應(yīng)用、信息三個部分?;A(chǔ)設(shè)施是服務(wù)器、存儲、網(wǎng)絡(luò),還包括電源等設(shè)施,上面有軟件組織起來的應(yīng)用,最上面的層次就是數(shù)據(jù)和信息。 所有信息都要預(yù)先建好共享的服務(wù)目錄,以 SOA架構(gòu)給整合起來,最終提供給業(yè)務(wù)用戶。這樣一系列的業(yè)務(wù)流程要自動化進(jìn)行提供IT服務(wù),這是未來數(shù)據(jù)中心的架構(gòu)。為了支撐下一代數(shù)據(jù)中心的這一架構(gòu),惠普歸納出了6個關(guān)鍵的技術(shù)要素,這些被抽象出來的要素被認(rèn)為是用戶新建或改造數(shù)據(jù)中心時的對照模板。 它們分別是IT系統(tǒng)與服務(wù)、電源與散熱、統(tǒng)一的管理、主動的安全、虛擬化和自動化。
IT 系統(tǒng)與服務(wù)是指標(biāo)準(zhǔn)化、模塊化和可擴(kuò)展的平臺技術(shù)。基于標(biāo)準(zhǔn)的軟硬件共同構(gòu)成了這一平臺, 并且可以靈活擴(kuò)展。 電源與散熱是數(shù)據(jù)中心的重要保障, 也與當(dāng)前的綠色節(jié)能計算節(jié)約總體成本關(guān)系最為密切。數(shù)據(jù)中心向高密度計算的方向發(fā)展, 很自然的問題是散熱怎么辦?本身供電就不夠又該怎么辦。這時,解決交流電的電源利用率如何提高,散熱效率和效果怎么提高的問題, 都需要有一整套綠色方案來對應(yīng)。如池化的電源管理、節(jié)約電源傳輸損耗、高功率密度超過了15%或者20千瓦以上時采用的水冷機(jī)柜等等。統(tǒng)一的基礎(chǔ)設(shè)施管理也是非常重要的技術(shù)要素,高昂的運維成本與能否做到高度集中的管理有很大關(guān)系,需要強(qiáng)調(diào)的是對整個平臺基礎(chǔ)設(shè)施的統(tǒng) 一 管理,比如 惠普的Software Conters工具,它的作用就是將平臺識別為統(tǒng)一界面,這對運維管理人員、系統(tǒng)人員來說非常實用。 統(tǒng)一管理可以實現(xiàn)高效運維,一個管理員就能管理上百個系統(tǒng),還可以快速解決問題,把時間的量級從小時降低到分鐘級。
安全可以分為三個層面,第一就是IT資源安全,通過可信平臺保護(hù)網(wǎng)絡(luò)、系統(tǒng)、軟件等資源;第二是數(shù)據(jù)安全,在存儲使用訪問每一個點都需要做到安全,這是非常重要的安全,第三是用戶身份安全,它不僅僅是一個技術(shù)問題,跟我們管理制度是息息相關(guān)的。來自數(shù)據(jù)中心內(nèi)部的威脅通常風(fēng)險最大。使用身份認(rèn)證和行動跟蹤系統(tǒng)可以有效地增加安全系數(shù)。同時,運行資料自動化和虛擬化也能夠改進(jìn)數(shù)據(jù)中心的運行和安全,并提供審計索引。
虛擬化是用來池化和共享IT資源以優(yōu)化利用率的技術(shù),最終實現(xiàn)IT共享的服務(wù)目標(biāo)。它不僅在主機(jī)上使用,目前在IA平臺上的虛擬化技術(shù)也已成熟,并在數(shù)據(jù)中心中呈普及態(tài)勢。用戶當(dāng)初為數(shù)據(jù)中心采購硬件系統(tǒng)時,幾乎都是按照最高負(fù)載來采購的,但實際上的資源利用率很低,據(jù)統(tǒng)計不超過25%。 而采用了虛擬化技術(shù)之后, 改變就非常明顯了。根據(jù)實際統(tǒng)計,通過服務(wù)器聚合,用戶最多可以達(dá)到70%的能耗節(jié)省, 而采用虛擬化技術(shù)還不只是要降低成本, 它還能夠為數(shù)據(jù)中心提升靈活性,進(jìn)而提升整體服務(wù)質(zhì)量。 現(xiàn)在不僅僅是服務(wù)器,還有存儲、網(wǎng)絡(luò)、電源都要走虛擬化的池化管理道路。
數(shù)據(jù)中心的自動化要實現(xiàn)動態(tài)的IT資源部署,以滿足業(yè)務(wù)變化需求。如果沒有實現(xiàn)自動化管理, 數(shù)據(jù)中心就需要有很多專職人員去管理設(shè)備、排查故障,這就為整個運維帶來了復(fù)雜性,如果對擁有成千上萬的服務(wù)器的數(shù)據(jù)中心來說,這樣的工作不啻于一場夢魘。未來的數(shù)據(jù)中心要無人值守,就必須有非常強(qiáng)的自動化技術(shù)。下一代數(shù)據(jù)中心的自動化應(yīng)該覆蓋從客戶端,到數(shù)據(jù)中心、網(wǎng)絡(luò)服務(wù)器的整個過程。 用戶通過CMDB 統(tǒng)一、共用地把數(shù)據(jù)庫管理起來,把所有運維、管理、變更的策略都預(yù)先制定好,發(fā)生事件后就可以自動響應(yīng)。雖然目前數(shù)據(jù)中心的自動化程度還不夠高,但發(fā)展形勢很好,自動配置和自動安裝補丁應(yīng)當(dāng)成為所有數(shù)據(jù)中心的必備功能。