閱讀53 返回首頁    go 阿裏雲 go 技術社區[雲棲]


北亞成功處理一起浪潮服務器不可用的案例

它有一個設計合理、功能強大的內部架構,大幅度提升了性能,但某些物理故障或其他操作都可能會對卷或存儲造成破壞,因此對係列存儲的數據恢複技術才有了用武之地。而發生這些故障之後隻能找專業的數據恢複公司做數據挽救工作。我最近處理了一起浪潮服務器因磁盤故障導致存儲不可用的案例:
故障描述:
寧夏某市某局中的一台浪潮服務器,底層是6塊300GB SAS硬盤組成的RAID。兩塊盤亮黃燈,導致RAID5崩潰,存放的是Oracle 數據庫文件,在服務器係統的上層一共分了1個卷,卷大小為1.5 TB。後因磁盤故障而導致服務器不可用,且已經過保,客戶便聯係到我們公司。
硬件檢測:
我們首先對客戶的6塊硬盤做了硬件檢測,發現客戶的2塊硬盤出現壞道、SMART的錯誤冗餘級別已經超過閥值。把4塊正常的硬盤進行全盤鏡像,另2塊有壞道的硬盤用專業工具進行了恢複並生成鏡像文件。
_1
圖一
故障分析:
分析兩塊硬盤的掉線時間,從而得知哪塊硬盤裏麵的數據是最新,用最新數據的硬盤進行數據恢複。
解決方案:
(對服務器的所有硬盤都進行相應的備份。之後隻對鏡像文件進行分析,保證用戶的原介質的安全。)
首先對6塊盤進行虛擬還原之前的RAID狀態,通過位圖信息在虛擬出來的RAID中把容量為1.5T的lun全部提取出來。
根據底層結構分析,導出用戶數據,並驗證數據庫文件是否正常。
我們將卷裏的文件都拷貝出來,交給數據庫工程師,進行數據庫驗證和數據的導入工作,數據庫文件校驗正常,也很順利的導入,之後把數據庫重新備份下,並把數據庫文件和備份文件一同交給用戶。數據恢複成功,用戶認可。

最後更新:2017-08-13 22:26:35

  上一篇:go  vue模板語法
  下一篇:go  龍果支付係統搭建與部署