歐洲頂級(jí)云數(shù)據(jù)中心著火,損失慘重!筑牢數(shù)據(jù)中心“防火墻”,可靠才是王道!
發(fā)布日期:
2021-03-24

瀏覽次數(shù):

514

近日,歐洲云計(jì)算巨頭OVH位于法國(guó)萊茵省首府特拉斯堡的數(shù)據(jù)中心發(fā)生嚴(yán)重火災(zāi)。這場(chǎng)熊熊大火給OVH數(shù)據(jù)中心造成了巨大的損失,也給整個(gè)數(shù)據(jù)中心行業(yè)敲響了警鐘。事實(shí)上,風(fēng)險(xiǎn)一直存在,我們能做的就是最大程度地避免悲劇再次發(fā)生。水火無(wú)情,可靠先行,如何保障數(shù)據(jù)中心的可靠運(yùn)行至關(guān)重要。


文章轉(zhuǎn)自網(wǎng)絡(luò)

如有侵權(quán),請(qǐng)聯(lián)系刪除


  近日,歐洲云計(jì)算巨頭OVH位于法國(guó)萊茵省首府特拉斯堡的數(shù)據(jù)中心發(fā)生嚴(yán)重火災(zāi)。其中最先起火的SGB2數(shù)據(jù)中心被完全燒毀,摧毀了所有服務(wù)器和數(shù)據(jù);SBG1建筑物部分受損,三分之一的服務(wù)器受到損毀;SBG3因受到消防保護(hù)暫未受到影響,以及SBG4確認(rèn)沒(méi)有受到波及。目前,該區(qū)域4個(gè)數(shù)據(jù)中心均暫時(shí)關(guān)閉了服務(wù)。


歐洲頂級(jí)云數(shù)據(jù)中心著火,損失慘重!筑牢數(shù)據(jù)中心“防火墻”,可靠才是王道!


  據(jù)報(bào)道,該數(shù)據(jù)中心起火后,導(dǎo)致約360萬(wàn)個(gè)網(wǎng)站癱瘓,1.2到1.5萬(wàn)名客戶的資料可能受到影響。OVH一家游戲公司客戶表示,大量玩家數(shù)據(jù)已經(jīng)因火災(zāi)丟失,且無(wú)法恢復(fù)。


歐洲頂級(jí)云數(shù)據(jù)中心著火,損失慘重!筑牢數(shù)據(jù)中心“防火墻”,可靠才是王道!


  這場(chǎng)熊熊大火給OVH數(shù)據(jù)中心造成了巨大的損失,也給整個(gè)數(shù)據(jù)中心行業(yè)敲響了警鐘。事實(shí)上,風(fēng)險(xiǎn)一直存在,我們能做的就是最大程度地避免悲劇再次發(fā)生。水火無(wú)情,可靠先行,如何保障數(shù)據(jù)中心的可靠運(yùn)行至關(guān)重要。


智能供電實(shí)現(xiàn)故障可視可管


  據(jù)數(shù)據(jù)統(tǒng)計(jì),數(shù)據(jù)中心基礎(chǔ)設(shè)施中斷有39%是由供配電引起,而供配電系統(tǒng)一旦中斷,損失將非常慘重。傳統(tǒng)供電系統(tǒng)采用分散部件集成的方式,不同廠家、不同品牌設(shè)備無(wú)法統(tǒng)一可視化管理,大部分設(shè)備為啞設(shè)備,發(fā)生故障無(wú)預(yù)警,難以迅速定位,導(dǎo)致數(shù)據(jù)中心可靠性低,易引發(fā)火災(zāi)隱患。


  通過(guò)融合數(shù)字化技術(shù),實(shí)現(xiàn)全鏈路可視可管,可大大增強(qiáng)數(shù)據(jù)中心的可靠性。如采用IOT技術(shù),可實(shí)時(shí)監(jiān)測(cè)電壓、電流、開(kāi)關(guān)狀態(tài)和關(guān)鍵節(jié)點(diǎn)溫度等參數(shù),可直觀展示異常狀態(tài),便于定位故障。同時(shí)通過(guò)大數(shù)據(jù)分析對(duì)關(guān)鍵器件壽命預(yù)測(cè),防患于未然。此外,備電系統(tǒng)作為關(guān)鍵子系統(tǒng),對(duì)數(shù)據(jù)中心可靠性的影響毋庸置疑。傳統(tǒng)鉛酸電池頻繁充放電會(huì)造成活性物質(zhì)軟化等反應(yīng),易膨脹爆炸引發(fā)火災(zāi)。而采用磷酸鐵鋰的智能鋰電系統(tǒng)可免去日常巡檢,在熱失控的情況下不產(chǎn)生氧氣,不起火,可靠性更高。


數(shù)字運(yùn)維實(shí)現(xiàn)風(fēng)險(xiǎn)可防可控


  傳統(tǒng)大型數(shù)據(jù)中心運(yùn)維依賴于人工運(yùn)維,對(duì)運(yùn)維工程師技能要求高,而現(xiàn)實(shí)中高達(dá)38%的數(shù)據(jù)中心招不到合格的運(yùn)維工程師。同時(shí)人工運(yùn)維效率低下,巡檢多為被動(dòng)響應(yīng),質(zhì)量不可控。數(shù)據(jù)顯示,2019年數(shù)據(jù)中心基礎(chǔ)設(shè)施失效故障率比2018年上升6%,其中80%為可預(yù)防性故障。由此可見(jiàn),傳統(tǒng)運(yùn)維模式在故障巡查、檢測(cè)、隔離均存在極大風(fēng)險(xiǎn)。


  隨著數(shù)字化變革不斷深入,數(shù)據(jù)中心基礎(chǔ)設(shè)施將逐步實(shí)現(xiàn)運(yùn)維的自動(dòng)駕駛。目前,通過(guò)數(shù)字孿生技術(shù),可實(shí)現(xiàn)部件級(jí)、設(shè)備級(jí)、系統(tǒng)級(jí)、鏈路級(jí)、機(jī)房級(jí)、多DC全局可視,分鐘級(jí)告警根因智能定位,可顯著縮短故障修復(fù)時(shí)間。同時(shí)融合人工智能技術(shù)、大數(shù)據(jù)分析對(duì)關(guān)鍵器件(風(fēng)扇、電容、電池等)壽命預(yù)測(cè),通過(guò)溫度、圖像、聲音識(shí)別進(jìn)行全鏈路預(yù)測(cè)性維護(hù),實(shí)現(xiàn)從被動(dòng)告警到主動(dòng)預(yù)防,極大提升系統(tǒng)的可靠性。


預(yù)制化架構(gòu)實(shí)現(xiàn)數(shù)據(jù)中心高可靠性


  傳統(tǒng)數(shù)據(jù)中心建設(shè)采用攢機(jī)模式,建設(shè)周期不僅長(zhǎng)達(dá)20個(gè)月以上,而且各個(gè)子系統(tǒng)之間孤立,規(guī)劃和建設(shè)分離,拼湊式建設(shè)模式給后續(xù)運(yùn)維管理帶來(lái)了極大的難度,風(fēng)險(xiǎn)不可控,影響整個(gè)數(shù)據(jù)中心的可靠性。


  而采用預(yù)制模塊化的建設(shè)模式,將各個(gè)子系統(tǒng)預(yù)集成在模塊內(nèi),在工廠進(jìn)行預(yù)制組裝,標(biāo)準(zhǔn)化生產(chǎn)流程,各個(gè)模塊品質(zhì)如一,多系統(tǒng)協(xié)同設(shè)計(jì),并且在出廠前完成全系統(tǒng)調(diào)試和測(cè)試,確保高質(zhì)量和高可靠性。同時(shí)現(xiàn)場(chǎng)只需完成極簡(jiǎn)施工,可大大降低現(xiàn)場(chǎng)管理難度及施工風(fēng)險(xiǎn),有效提升數(shù)據(jù)中心可靠性。


  本次歐洲頂級(jí)云數(shù)據(jù)中心著火事件敲響的警鐘,也進(jìn)一步印證了打造高可靠的數(shù)據(jù)中心,需要從部件、設(shè)備、子系統(tǒng)上升至整體來(lái)考慮。作為數(shù)據(jù)中心領(lǐng)域的創(chuàng)新領(lǐng)導(dǎo)者,華為從全局視角出發(fā),緊緊圍繞數(shù)據(jù)中心的整體可靠性,創(chuàng)新打造預(yù)制模塊化數(shù)據(jù)中心解決方案。該方案融合AI、預(yù)制模塊化建筑、數(shù)字化全生命周期管理等多重創(chuàng)新技術(shù),將智能IT模塊、智能電力模塊、智能溫控模塊、智能管理平臺(tái)等核心子系統(tǒng)全部預(yù)集成預(yù)測(cè)試,所“見(jiàn)”即所得,顯著降低施工和交付風(fēng)險(xiǎn)。樂(lè)高式搭建,現(xiàn)場(chǎng)土建與工廠生產(chǎn)同時(shí)進(jìn)行,可縮短50%以上建設(shè)周期。同時(shí)將人工智能和數(shù)字化融入數(shù)據(jù)中心的規(guī)劃、建設(shè)、運(yùn)營(yíng)、運(yùn)維、優(yōu)化迭代全過(guò)程,貫穿全生命周期,實(shí)現(xiàn)全鏈路可視,AI預(yù)測(cè)性維護(hù),防患未然,筑牢數(shù)據(jù)中心的堅(jiān)實(shí)“防火墻”。