閱讀256 返回首頁    go 阿裏雲 go 技術社區[雲棲]


某研究院dell存儲 raid5 XFS磁盤陣列數據丟失恢複案例

數據恢複故障描述:
某研究院 DELL 磁盤陣列崩潰,內置15塊1TB硬盤搭建的RAID5陣列。一開始有一塊硬盤離線,在更換新硬盤進行同步的過程中,第二塊磁盤指示燈報警,同步失敗,陣列無法正常工作。

故障初步檢測:
存儲介質物理狀態:最先離線的硬盤訪問速度極其緩慢,第二塊離線的磁盤有少量壞扇區,其他磁盤無明顯物理問題。
存儲介質邏輯狀況:整個陣列隻包含一個卷組,該卷組占用陣列全部空間;並且該卷組隻有一個起始位置為0扇區的XFS裸分區。

數據恢複故障分析:
RAID5陣列架構在設計上隻支持一塊磁盤的錯誤冗餘功能,當第二塊磁盤離線後陣列便無法正常工作。
根據用戶描述可知,整個陣列的崩潰主要由第二塊磁盤造成。所以第二塊磁盤的處理是此次恢複的關鍵

數據恢複過程:
1、對所有硬盤做隻讀鏡像的備份,單獨備份第二塊離線的硬盤,備份過程中略過壞扇區。
2、對15塊硬盤鏡像文件進行異或測試,全部通過,無明顯錯誤。
3、計算第二塊硬盤損壞扇區位置的數據,並將其寫入鏡像文件。
4、在備份過程中同時分析原RAID組成結構,構建虛擬RAID環境。
5、驗證RAID結構是否正確。
6、將第二塊磁盤的鏡像備份到新硬盤,並將其強製上線,更換第一塊磁盤,並對其進行同步。(注意:在操作之前要對所有硬盤進行備份)
7、拷貝數據。

數據恢複結論:
因為異或測試完全通過,所以表明該存儲發生故障後沒有新數據寫入,或結構改動。
所以可以根據其他幾塊好硬盤計算出壞硬盤對應位置的數據。
恢複完成後,目錄結構完整,重要文檔全部完好。FSCK無任何錯誤提示,客戶認可所恢複的數據,恢複成功。

最後更新:2017-09-20 16:32:53

  上一篇:go  《數字視頻和高清:算法和接口》一第3章 線性光和感知均勻性
  下一篇:go  重新定義雲數據庫 阿裏雲POLARDB 9月21日發布