6塊300G SCSI RAID5,兩塊硬盤損壞後的數據恢複過程
【用戶單位】
XXXX網站
【數據恢複故障描述】
DELL POWEREDGE 2850服務器,內置6塊300G SCSI硬盤 ,組成RAID5,安裝LINUX REDHAT 4操作係統,存儲大量照片,文件係統采用EXT3。據後期推斷,早先已有一塊硬盤離線,但機房內並未發現,直至另一塊硬盤掉線後係統癱瘓才知道。DELL工程師建議將其中一塊硬盤強製上線,但同時指出操作具有風險。用戶將某盤強製上線後,發現操作係統啟動時異常,感覺不妙,於是關掉服務器,尋求專業數據恢複機構服務。
【數據恢複故障分析】
此類故障非常普遍,RAID5僅支持唯一一塊硬盤掉線的冗餘保護,當兩塊硬盤先後離線後,RAID即無法通過運算提供完整數據塊,RAID便會下線。同時,控製器為了穩定起見,隻要有硬盤下線,便不會自動上線,這樣不通過人為幹預,RAID但會進入癱瘓狀態。通常情況下,因RAID控製器的敏感性,掉線的硬盤多數不會有嚴重的物理問題,許多甚至於硬盤完好(掉線是因為信號受阻,電源波動或控製器BUG等隨機原因),所以數據恢複的可靠性較高。強製上線具有較大的風險,如果上線錯誤,會導致控製器自動做某些不可逆的操作,如果再進入操作係統,因文件係統不一致,會導致修複,繼而導致全部硬盤數據不一致。本例即是如此。
【數據恢複過程】
1、完整備份所有硬盤,發現有多塊硬盤已經存在壞道,隻是RAID沒有讀到,暫時無下線。
2、在備份中分析原來RAID的組成結構,構建虛擬RAID環境。
3、驗證RAID結構正確,修正部分後期破壞的結構後將數據導出到另一中間存儲。
4、重新用完好硬盤搭建DELL 2950上的新RAID5。
5、將數據遷移至新RAID。
【數據恢複結論】
曆時2天,數據庫100%恢複成功。上千萬圖片文件中抽樣檢測,有極少數出現問題(概率及理論推斷,不超過萬分之一)
【數據恢複服務承諾】
1 .免費檢測
2. 與客戶簽訂保密協議(非定製免費),對客戶的數據嚴格保密
3. 數據恢複不成功不收費
4. 專業工程師提供服務,同時由其他工程師審核、會診數據恢複方案及流程
5. 數據恢複前報價,客戶確認後工程師開始數據修複
6. 整個恢複過程不會對客戶的原盤有任何的寫操作,以確保原盤的數據完全
最後更新:2017-06-09 15:31:26