盤點全球數據中心災難史 看數據中心選址與災備

2012年12月10日 10:16
來源:中關村在線
數據中心,支撐整個IT系統(tǒng)正常運轉的后臺架構,囊括了計算、存儲、網絡等多種IT資源。也正是因為數據中心地位的重要性和在現代社會生活中扮演的重要角色,使得數據中心的安全和持久穩(wěn)定運行成為了人們極為關注的問題。然而,前段時間颶風桑迪為代表給數據中心帶來的災難性創(chuàng)傷,再次引發(fā)了人們對數據中心的安全擔憂。本文,將為讀者介紹全球數據中心遭遇到的災難事故,并從中總結得出數據中心安全殺手以及如何防范等問題。
本月早些時候,颶風桑迪重創(chuàng)美國東海岸,尤其是支持著整個工業(yè)園運轉的數據中心在此次颶風肆虐中因斷電而癱瘓,造成了難以挽回的巨大損失。
那么,數據中心常見的殺手有哪些呢?換句話說,究竟有哪些因素會影響數據中心的正常運行、而需要我們特別加以重視的呢?一般說來,以下因素或者災害對數據中心會帶來較大危害:
一、洪災 
毋庸置疑,曾經泰國洪災給硬盤產業(yè)帶來的影響就可以“窺一葉而知春秋”,數據中心也同樣害怕洶涌的洪災;
二、火災
俗話說“大火無情”,一旦出現火災事故,后果不堪設想。也正是如此,數據中心往往都備有消防裝備;
三、網絡中斷
光纖網絡在很多偏遠地區(qū)并不常見,如果路由器、交換機出現宕機或者人為誤操作(誤配置)導致網絡中斷,后果同樣不堪設想。沒有網絡的數據中心宛如一座孤島——對于提供 網絡或者云服務的數據中心來尤其如此;
四、電力中斷
相比網絡中斷,電力中斷帶來的麻煩更大。沒有電力的數據中心就如同一堆廢鐵;
五、地震
去年日本大地震帶來的影響,大家可能都歷歷在目。身處地震帶或者地震頻發(fā)周邊的數據中心尤其要注意在防震方面的設計和構建。
另外,數據泄露、系統(tǒng)崩潰、網絡攻擊、人為失誤和冗余出錯,都會給數據中心的正常運營帶來巨大危害。下面,我們將為大家介紹曾經遭遇過巨大創(chuàng)傷的數據中心。
【事故檔案】
時間:2008年3月19日
地點:美國
起因:火災
損失:數據中心遭毀,歷時十天才得以修復。
2008年3月19日,美國威斯康辛數據中心被火燒得一塌糊涂。根據事后統(tǒng)計,這次大火已經燒掉了75臺服務器、路由器和交換機,當地大量的站點都癱瘓。該數據中心屬于當地一家“Camera Corner/Connecting Point”的公司所有,該公司主營網站托管和其他IT服務。
這次事故,給當地網站帶來了巨大損失。耗時10天的修繕和重新部署,才使得這些網站得以上線。該公司CEO Rick Chernick也一再強調,公司為該數據中心投放了火災險,而且數據中心的警報裝置減輕了火災帶來的進一步損害。
然而,該數據中心耗時十天才得以完全恢復過來,足以說明該數據中心在當時并沒有完備的備份計劃。
同樣還遭遇火災影響的數據中心,有來自莫斯科的ISP服務器機房。根據監(jiān)控畫面我們知道,該數據中心起火原因是墻壁上的電閘開關短路而導致的。工作人員利用手中的各種工具將涌向服務器的煙霧和火花進行撲滅。然而值得稱贊的是,盡管如此,該機房并沒有中斷電力。因為他們部署了UPS系統(tǒng),這一點對于其他數據中心的設計和建筑來說都極具參考意義。
2009年7月,位于西雅圖的Fisher Plaza數據中心的變壓器起火引發(fā)火災。此次火災影響甚大,造成了包括微軟Bing Travel、Authorize.net、Redfin、Big Fish Games、Survey Analytics等網站服務器的中斷運行。這次事故在同一時間段引發(fā)了很多其他數據中心的宕機。
從此次災難中,我們應該學會在選擇數據中心服務商的時候,應該了解事故發(fā)生后網站需要多長時間從宕機中恢復過來。如果答案在幾天甚至幾周,那么可以考慮選擇其他更值得信賴的服務商。
另外,我們也特別需要有完整災備計劃的事后措施,在數據中心場地和周邊,務必有科學合理的消防設備和設計方案,數據中心的各個角落應該有盡可能多的消防器材。(在不影響通行和通風散熱的情況下)
【事故檔案】
時間:2009年9月9日
地點:土耳其
起因:暴雨引發(fā)洪災
損失:數據中心遭淹
2009年9月9日,土耳其伊斯坦布爾遭遇暴雨并引發(fā)了洪水。瘋狂肆虐的洪水淹沒了該市Ikitelli區(qū)的大部分地段,也淹沒位于該區(qū)的Vodafone數據中心。
城市里的很多Vodafone(沃達豐)手機用戶都因該數據中心被淹而無法使用通信服務。上圖展示的是監(jiān)控攝像頭拍下的畫面:數據中心的一名員工在收集自己的東西撤離數據中心。
伊斯坦布爾Ikitelli地勢較為低洼,南北毗鄰愛琴海和黑海。因此,在遭遇暴雨的時候就特別容易引發(fā)洪水。此次洪水在當地造成了很大的影響,甚至街道上的很多車輛都被沖走。
同樣遭受洪災影響的,還有來自澳大利亞的Datacom網絡中心。這次洪災發(fā)生在澳洲的時間是在2010年,當時的大暴雨將Datacom主機代管中心的天花板沖毀,使得服務器、存儲和網絡設備都遭損壞。起初該公司否認出現問題,但隨著事故在網絡上得到曝光,人們逐漸知道了真相。
Hunt Valley數據中心也曾遭遇了“有驚無險”的侵襲。在2008年的時候,洗手間的一根管道爆裂并涌出大量的水。好在該中心的服務器機柜設計較為合理,離地間距為4英寸(1英寸=0.0254米),而且管理人員在午休回來后及時發(fā)現并處理了該險情。
從以上幾個實例中我們不難發(fā)現,為了避免洪災對數據中心帶來的潛在危害,我們應該對數據中心的選址、海拔、機柜離地間距甚至是整個數據中心建筑物的設計,都需要有一個充分的科學論證,以防后患。
【事故檔案】
時間:未知
地點:未知
起因:光纖被淹
損失:業(yè)務中斷
這起事故源自國外一名IT管理人員發(fā)出的視頻而得出。在視頻中,由于下水管道爆裂,位于地下室的數據中心被水浸入。
可能有人會問,僅僅是下水管道爆裂怎么會引發(fā)網絡中斷呢?(不是洪水,數據中心也沒有被淹沒)。其實,主要原因是當時一家電信公司打算將光線網絡鋪設在下水管道上,并通過下水管道的走向來安排布線。圖中所示的就是光纖網絡被爆裂管道的水所淹沒的場景。
除了網絡中斷,也有電力中斷的例子。比如接下來要介紹的數據中心。如上圖所示,工作人員按慣例檢查UPS的電壓和電流情況。然而,當他進入數據中心的時候,其中一個UPS宕機并且火花四濺,煙火瞬間彌漫整個機房。
另外,我們這里還要介紹一種意外事件帶來的潛在威脅。當IT管理員周末步入數據中心查看的時候發(fā)現,機房頂端的天花板已經濕透并逐漸往下滲水。滲出來的水流入到地面并不斷積壓。管理員發(fā)現后立即將水桶放到滲水的位置,避免水位進一步提升。
經過后來的檢查發(fā)現,這些水來自于空調管道,而這些管道被鋪設在天花板上方,而且沒有經過嚴密的密封處理。
無論是空調管道還是下水道,其實都是設計方面存有缺陷。對于這種問題,在搭建數據中心的時候就需要嚴格按照設計要求來執(zhí)行。同時,也需要進一步加大對UPS和數據中心物理設施的常規(guī)定期檢查。
【事故檔案】
時間:2011年3月11日
地點:日本
起因:9級地震
損失:設備受損
3月11日,日本遭受了9級大地震,上萬人失去了生命,數百萬人受到嚴重影響。在此次地震中,日本東京的IBM數據中心也受損嚴重。包括很多大型機和傳統(tǒng)服務器受損,服務器機柜東倒西歪,金屬外框也出現了變形,甚至有些大型機的線纜都暴露在外。
不過,由于IBM數據中心線纜長度和松緊度的合理設計,而且,作為自動觸發(fā)進行錯誤檢查的一項預防措施,IBM存儲單元也同樣保持正常運行。在此次地震中的IBM服務器還能正常運行。
另外值得一提的是,2012年初的時候,加爾各答的一家銀行被大伙無情吞噬。煙霧擴散至樓上九層。消防員趕來的時候,該機房也被火燒掉面目全非,只留下了機柜的空殼和天花板上的一些線纜。
前面我們給大家介紹了遭受洪災、火災、網絡中斷、地震破壞的數據中心,從這些災難事件中,我們也深刻地體會到災害的無情和兇猛,也意識到在設計規(guī)劃、建造部署數據中心的時候,需要經過多番論證,建立多套應急措施和備份系統(tǒng)。
根據全球保險公司Axa安盛的一份報告,80%的中小企業(yè)在遭受重大事故后的18個月內都面臨著關門破產或者難以為繼的困境。與此同時,更大型公司在遭受重大事故時,則會蒙受巨額的財產損失和名譽
下面,我們將為大家提煉出幾個構建數據中心值得關注的問題。這些對于保障IT系統(tǒng)7×24不間斷運行、為業(yè)務發(fā)展提供源源不斷的支持所應該具備的要素:
一、數據中心的選址
正如我們前提提到的,很多發(fā)展洪災的數據中心,都是位于地勢低洼、臨近河道或者海邊的地理位置。而且很多地震頻發(fā)或者環(huán)地震帶也不宜構建數據中心。選址問題,重點可以考慮自然地理條件、配套設施、周邊環(huán)境、成本因素、政策環(huán)境、高科技人才資源環(huán)境、社會經濟人文環(huán)境。
二、建立數據中心災備計劃
即使發(fā)生諸如地震、水災、雷擊、火災、機器故障這些偶然事件,也必希具備很高的安全可靠性以保證業(yè)務不會停止。為了提高數據中心的安全可靠性,有必要建立完善的數據中心災備計劃。
災備計劃其實應該包括軟硬件層面。軟件層面包括人為的風險評估、定期審查、軟件系統(tǒng)的相互依存和備份。硬件層面包括硬件冗余、UPS、數據備份、異地災備等等。
三、融合數據中心
由于成本和備份關鍵系統(tǒng)和數據同步的復雜性,很多企業(yè)不惜代價創(chuàng)建一個備份數據中心。隨著業(yè)務的發(fā)展,數據中心的問題與日俱增,數據中心管理者所面臨的壓力和挑戰(zhàn)也越來越大,企業(yè)業(yè)務的不斷調整和改變讓數據中心總體架構面臨極大的壓力、有限的物理空間讓數據中心擴展性和靈活性有所限制。
為此,融合數據中心是唯一的出路,只有通過有效的整合才能夠讓傳統(tǒng)數據中心升級成為一個智能化、自動化、高效化的數據中心。
四、虛擬化技術
很多明智的企業(yè)都轉向虛擬化,從而大大降低成本。在緊急情況下,這也是快速恢復IT活力的一種方式。利用虛擬化技術,可以將操作系統(tǒng)、應用軟件和數據打包裝入到基于操作系統(tǒng)之上的應用軟件中。封裝的應用程序可以很容易的傳輸到場外——作為數據的一種傳輸方式,并為遠程計算機用戶提供訪問。虛擬化技術可以大幅減少停機時間,將宕機時間從數天減少到數小時。
當然,在數據中心的具體產品層面,比如在應對地震等自然災害的時候,可以將數據中心構建在減震器上面——用金屬和橡膠制成并安放在建筑物內的隔離層,可以吸收地震發(fā)生時帶來的震動。某些數據中心擁有樓級和機架級的減震隔離層。此外,所有的服務器機架設施,冷卻設備和其他設施都牢牢地受到地板的保護。
免責聲明:凡本站注明 “來自:XXX(非家在臨沂網)”的新聞稿件和圖片作品,系本站轉載自其它媒體,轉載目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責。如有新聞稿件和圖片作品的內容、版權以及其它問題的,請聯系本站新聞中心,郵箱:405369119@qq.com

合作媒體

  • 搜房網
  • 焦點房產
  • 騰訊藍房
  • 齊魯晚報
  • 魯南商報
  • 交通電臺
  • 臨沂在線
  • 山東房產聯盟
區(qū)域:
姓名:
手機:
QQ:

家在臨沂網團購報名