對(duì)于(yú)IT管理員而(ér)言,遭遇RAID數據災難總是最爲頭痛的,因爲相關恢複技術涉及到的知識面太廣,普通管理員甚至服務器廠商的工程師都無法解決。既然RAID數據災難不應當由管理員來進行(háng / xíng)處理,那(nà)麽管理員在此時又應該如(rú)何處理呢?我們采訪了的資深數據恢複工程師,他将告訴您如(rú)何才能(néng)确保較高的恢複成功率。
不要(yào / yāo)強行(háng / xíng)上線:危險的操作方法
在服務器的某一個硬盤出現故障時,一般服務器都會(huì)有一個Offline指示燈提示,此時要(yào / yāo)求用(yòng)戶更換一個完好的相同硬盤,并且重新校驗算法。按理說這是非常正常的操作過(guò)程,但是殊不知很多RAID災難就(jiù)是由此而(ér)引起的。
以一個硬盤數量比較多的RAID5磁盤陣列爲例,很可(kě)能(néng)同時采購的多個硬盤中,有幾個已經出現了不穩定現象。而(ér)服務器的Offline提示可(kě)能(néng)并不是最準确的,經常會(huì)誤報(也有硬盤不穩定的因素)或是遺漏其(qí)它也同樣存在隐患的硬盤。在看似平常的強制上線過(guò)程中,硬盤需要(yào / yāo)進行(háng / xíng)大量的讀寫操作,此時就(jiù)是一場嚴峻的考驗:運氣好的話自(zì)然平穩度過(guò),而(ér)運氣不好就(jiù)會(huì)導緻其(qí)它硬盤突然掉線,此時就(jiù)令問題更加棘手了。
當然,出現一個硬盤掉線提示,或是在RAID容錯範圍以内的掉線提示,強制上線還是必須執行(háng / xíng)的操作。但是在進行(háng / xíng)這一步前,強烈建議大家(jiā)檢測一下(xià)每一個硬盤的穩定性情況,這樣才更加保險。大家(jiā)可(kě)不要(yào / yāo)忽視這樣一個小細節,往往這一步能(néng)夠讓RAID服務器沒免于(yú)癱瘓。
保護第一現場:什麽都不做才最安全
對(duì)于(yú)廠商而(ér)言,所(suǒ)有的質保承諾僅僅局限于(yú)硬件設備,也就(jiù)是說磁盤陣列故障後(hòu)所(suǒ)引發(fā/fà)的數據危機與之毫無關系,負責爲用(yòng)戶更換或者維修已經算是“克盡職守”。但是用(yòng)戶所(suǒ)需要(yào / yāo)的并不是找回硬盤或是重建RAID,而(ér)是更價值不菲的數據。如(rú)果尋找整機廠商,此時無異于(yú)“自(zì)讨苦吃”,因爲所(suǒ)謂的售後(hòu)服務根本沒有從用(yòng)戶的本源需求出發(fā/fà),盡快确保硬件設備完好反而(ér)犧牲了數據。當然,知名品牌的服務器廠商或是代理商會(huì)主動選擇爲大客戶的RAID數據恢複服務費“埋單”,但是這也僅僅是個别情況。
據數據恢複中心的主管工程師介紹,因爲尋找服務商的售後(hòu)服務工程師修複而(ér)導緻最終數據徹底破壞的案例幾乎每個星期都會(huì)發(fā/fà)生(shēng)。畢竟售後(hòu)服務工程師基本都偏向于(yú)硬件,而(ér)RAID數據恢複則是以軟件類操作爲主。
此外,即便是簡單的檢驗性操作,也有可(kě)能(néng)爲後(hòu)期的數據恢複帶來不便。以普通RAID5恢複爲例,當硬盤損壞超過(guò)容錯能(néng)力時,必須将損壞硬盤的鏡像完全提取才能(néng)進行(háng / xíng)最終的恢複。而(ér)如(rú)果頻繁對(duì)硬盤上電,很容易造成磁頭進一步疲勞損傷,甚至劃傷盤片。正确的處理方法應當是立即咨詢專業數據恢複服務商。
選擇專業數據恢複服務商:切莫迷失方向
根據數據恢複中心的統計,很多數據恢複失敗的案例都是因爲用(yòng)戶尋求了并不正确的解決途徑。服務器用(yòng)戶所(suǒ)依靠的售後(hòu)服務也往往不夠專業,RAID 磁盤列陣出現問題之後(hòu)輕易選擇重建,數據丢失情況更是雪上加霜。在選擇數據恢複服務商時,根據規模以及業界口碑來判斷是一條可(kě)行(háng / xíng)的捷徑。而(ér)在這一方面,服務網點遍及全國的數據恢複中心有着(zhe/zhuó/zhāo/zháo)深厚的積累,能(néng)夠幫助廣大遭遇RAID數據災難的用(yòng)戶及時度過(guò)難關。