閱讀130 返回首頁    go 群英


【推薦】Windows係統異常重啟以及藍屏的處理__藍屏夯機_操作係統類問題_Windows操作運維問題_雲服務器 ECS-阿裏雲

Windows 係統下,藍屏(BSOD, Blue Sceen of Death)是客戶有時會遇到的錯誤,Windows 操作係統在遇到異常的情況下,為了防止數據丟失,係統自動崩潰藍屏,如果有配置內存轉儲文件(crash dump)的收集,係統會自動生成藍屏dump到指定的目錄(默認文件為C:Windowsmemory.dmp)。

可能原因


有多種原因導致操作係統藍屏,例如:

  • 因為誤操作或者病毒引起的係統文件、注冊表損壞
  • 驅動程序與操作係統兼容性引起的異常內存訪問
  • 操作係統自身bug
  • 三方殺毒軟件驅動異常

操作係統在藍屏的情況下,會拋出對應的bugcheck code以及可能的導致藍屏的模塊來大概說明問題發生的原因。如下圖,

微軟官方列舉了如下bugcheck code,詳細請參考如下鏈接:
Bug Check Code Reference 
https://msdn.microsoft.com/en-us/library/windows/hardware/ff560129(v=vs.85).aspx

對於用戶而言,更重要的是如何處理Windows 藍屏,請參考如下最佳實踐以及跟進方案。

最佳實踐


根據與微軟官方的建議以及日常排查經驗,為了防止係統藍屏的發生以及可能引起的數據丟失,我們建議客戶:

  • 請在ECS上啟用安騎士防護或其它商業版殺毒防護工具,定期殺毒,定期更新殺毒軟件版本,防止病毒或者殺毒軟件驅動與操作係統兼容性引起的藍屏。
  • 請定期運行Windows Update,確保微軟最新安全更新已經安裝。
  • 請不要將重要數據放在係統盤,而是使用數據盤。
  • 定期對係統盤、數據盤進行快照,以便問題情況下恢複數據。
  • 請在修改係統注冊表前備份注冊表文件,避免修改係統文件

跟進方案


如果 Windows ECS 在使用過程中突然斷開、無法遠程,查看日誌發現異常重啟的情況,懷疑可能出現過係統藍屏,請采用如下方法驗證:

方法1:打開”事件查看器”,打開”係統日誌”, 在問題發生時間點,如果看到有來源”volmgr”拋出的 ID 46事件,說明之前發生過藍屏,但是由於沒有配置 paging file 頁麵文件以及內存轉儲文件的配置,導致 dump 收集失敗。

    錯誤    2016/3/25 0:42:55    volmgr    46    無
    故障轉儲初始化未成功

方法2:如果之前有正常配置過藍屏收集,在係統日誌中可以發現事件 ID 41的Kernel-Power的關鍵錯誤日誌,提示係統從意外的關閉中回複以及事件ID 1001,來源為Bugcheck的日誌提示係統出現崩潰。

由於藍屏日誌的分析非常耗時,可能耗費一周或更多的時間。考慮到業務快速恢複,我們強烈建議客戶在遇到藍屏的情況,重啟機器後,參考如上的最佳實踐。尤其是根據我們的經驗,一般病毒、三方殺毒軟件和係統bug是最可能的原因,您可以在問題發生後,采用如下3條來避免潛在的已知問題。
<1> 卸載係統所有三方殺毒軟件, 禁用殺毒軟件的防護功能一般不會消除殺毒軟件內核驅動的影響
<2> 安全模式下,使用微軟Msert離線殺毒工具或者三方收費版本殺毒軟件殺毒
<3> 運行Windows Update,安裝所有更新

如果問題仍然發生,建議參考知識點“ECS Windows開啟內核轉儲(Core Dump)配置說明”收集數據,工單反饋進一步分析。

閱讀須知


本文僅供用戶使用 ECS Windows 時參考,文中引用的微軟官方鏈接,版權歸屬微軟。請注意文章適用的操作係統範圍,以及微軟 Windows 產品迭代或者文檔未及時更新可能帶來的問題,阿裏雲官方不對引用的微軟官方鏈接內容負責。
如果您對文檔內容有疑問或認為文檔內容有誤,請及時通過文檔下方的評價板塊反饋給我們,我們將酌情改進修正。

,如果問題還未解決,請聯係,售後技術支持,。

 

 

最後更新:2016-07-18 16:50:24

  上一篇:go 雲服務器 ECS Linux SSH 無法遠程登錄問題排查指引__遠程登錄 (SSH)_Linux操作運維問題_雲服務器 ECS-阿裏雲
  下一篇:go 產品簡介___高性能計算-阿裏雲