MSSQL ndf文件大小變為0 KB後的數據恢複過程
一、故障描述
成都某客戶,存儲損壞,數據庫崩潰。重組存儲,恢複數據庫文件,發現有四個ndf文件大小變為0 KB。數據庫大小約80TB。數據庫中有1223個文件,數據庫每10天生成一個NDF文件,每個NDF大約500GB,數據庫包含兩個LDF文件。
二、故障分析
存儲損壞,NDF文件大小變為0 KB,根據NDF文件在磁盤上可能存在。可以通過編寫數據庫掃描碎片程序,掃描數據庫碎片、拚接碎片恢複NDF文件,然後修複數據庫。
三、恢複過程
1 磁盤掃描,掃描數據庫碎片
2 拚接碎片
根據NDF文件的頁麵特征,按照文件號,頁號拚接碎片,重組生成出這些0kb的NDF文件。
3 檢測數據庫文件
使用北亞MSSQL文件檢測工具對所有數據文件進行檢測,結果:拚接出的4個NDF文件有少量的空頁,其他文件正常。
4 進一步對損壞lun進行分析,發現這些數據頁在存儲層麵已經不存存在了。不能恢複這些數據頁,即這4個文件不能完全恢複
5嚐試附加數據庫,報錯 “處理數據庫的日誌時出錯,如果可能請從備份還原。如果沒有可用的備份,可能需要重新生成日誌”。
6、無日誌附加數據庫
修改係統表,從係統表剔除掉最後添加的LDF文件,計算並修改校驗。進行無日誌附加數據庫。報錯:數據庫存在一致性錯誤,
如下圖一:
7 修改係統表中這4個損壞的NDF文件的塊數量,使其和恢複出來的文件的塊數量一致
修改係統表,將係統表記錄這4個NDF的塊數量的值改為和掃描出來的NDF文件塊數量一致,同時更改這4個NDF文件首頁,使得數據庫中記錄的文件的塊數量和拚接出來的NDF的塊數量一致,計算並修改校驗值。
8 無日誌附加數據庫,報錯數據庫存在一致性錯誤,
如下圖二:
9 逐個修改係統表中這4個損壞的NDF文件的塊數量,使其值等於報錯塊前一頁
分析報錯,由於空頁都出現在這4個NDF後麵十幾個塊中,截斷文件對數據完整性影響不大。重新修改係統表和NDF文件,將數據庫中記錄NDF塊數量的值改至報錯的前一頁,計算並修改校驗。
10 、重新進行無日誌附加數據庫,報錯“由於數據庫沒有完全關閉,無法重新生成日誌”
如下圖三:
11、修改MDF文件中的數據庫的狀態值,讓數據庫認為是完全關閉的
12、重新附加數據庫,附加成功
如下圖四:
**四、結果 **
數據庫文件成功附加後,客戶通過數據庫中的對象進行初步查詢、驗證,表中信息基本完整,數據得到恢複。數據驗證完畢,客戶對恢複結果表示滿
最後更新:2017-06-06 07:36:34