服務器RAID信息丟失怎麼恢複數據?
【數據恢複故障描述】
客戶服務器屬於HP品牌DL380係列,存儲是由6塊73GB SAS硬盤組成的RAID5,操作係統是WINDOWS 2003 SERVER,主要作為企業部門內部的文件服務器來應用,主機(無UPS)故障前經曆過幾次意外斷電,重啟後RAID報錯,提示無法找到存儲設備,進入RAID管理模塊後操作死機,重啟後問題依舊,用戶聯係到我們公司並且把設備帶到我公司。
【數據恢複故障分析】
主機意外斷電導致RAID模塊損壞(包括RAID管理信息丟失和RAID模塊硬件損壞)的情況並不少見,一般來說,RAID創建完成後,其管理模塊的信息就不會再發生改變,但這部分信息畢竟屬於可修改信息,意外斷電很容易造成這部分信息被篡改甚至丟失,多次斷電甚至有可能導致RAID卡上的元器件損壞,從而使主機失去對多塊物理硬盤進行RAID管理的中間層模塊。該案例中對RAID模塊的操作死機現象極有可能是由RAID卡硬件損壞引起的(後經HP售後技術人員驗證得到證實),此時通過正常途徑已無法將獲取6塊硬盤中的數據,隻能依靠第三方提供數據恢複服務來解決。
【數據恢複過程】
1.首先針對用戶提供的6塊SAS硬盤進行嚴格的物理檢測,6塊硬盤讀取狀態均良好;
2.分別鏡像用戶故障RAID組中的6塊硬盤,為保證絕對的數據安全,目標存儲為帶有冗餘功能的陣列存儲;
3.鏡像完成後,對所生成的6個備份文件進行RAID結構分析,依據文件係統存儲規則確定6塊硬盤在構建RAID5的盤序、數據塊大小及校驗方式,並於虛擬環境中重新構建RAID組;
4.對所構建RAID中的數據進行邏輯校驗,確保重構RAID所應用的各參數正確無誤後,針對用戶最為關注的數據進行完全驗證;
5.用戶確認數據恢複結果已完全達到預期(數據恢複至故障前狀態)後,將所有用戶業務數據遷移至用戶存儲,至此數據恢複完成
【服務器存儲安全建議】
1.盡量保證機房電源供應穩定,以減少電源異常對主機及存儲的衝擊;
2.最好為重要的服務器及存儲配置UPS,可在機房意外斷電的情況下保證核心業務係統能繼續維持一定時間的正常工作,從而為企業尋求應急解決方案贏得寶貴的時間;
3.對於服務年限已久的服務器應定期進行安全狀況檢查,並對其整體運行狀態進行評估以決定是否進行硬件及係統的全麵升級,同時提前製定突發數據災難的緊急處理方案,以降低數據災難帶來的業務損失。
最後更新:2017-05-09 14:31:37