102 人物

服務器負載暴漲以後

打開nagios監控見麵，發現3個服務器（3個服務器處於同一個集群下，業務為論壇，同時在線人數大概4萬人）的load過高，處於warning狀態 1、先查看訪問流量，通過對比，跟以前沒什麼差別。 2、查看每個服務器的進程數和cpu使用情況，跟以前也沒什麼差別。 3、查看係統日誌，每個服務器都有“TCP: Treason uncloaked! Peer 113.247.241.146:21345/80 shrinks window 2128147967:2128149427. Repaired.” 4、查看php日誌，大量“[WARNING] fpm_request_check_timed_out(), line 158: child 25379, ｓｃｒｉｐｔ ‘/mnt/html/bbs/forum.php’ (pool default) execution timed out (120.306361 sec), terminating”。打開論壇首頁，居然花了120多秒。我在php配置文件裏設置的執行中斷時間是120秒，超過這個值則關閉該子進程。看來應該從這裏下手了。先問問其他人，最近有沒有改程序，有沒有加插件？答：“沒有”。我再仔細檢查了係統：（1）查看有沒有文件係統損壞而不能寫入（2）查看分區是否滿（實際上滿了的話，有短信報警的）（3）查看tcp連接狀態，還沒以前多呢，看來不是係統的問題那麼，與之有關聯的還有數據庫、nfs文件係統以及memchached。先檢查容易的，好！先檢查nfs，正常；再檢查memcached，正常。看來估計數據庫有什麼問題了。登錄數據庫，先查看數據庫錯誤日誌，tail –f 一下，滾動輸出，看來問題找到了。輸入的內容主要有一下幾行：

[ERROR] Got error 134 when reading table ‘./uc_mumayi/cdb_uc_members’ [ERROR] Got error 134 when reading table ‘./uc_mumayi_net/cdb_uc_members’ [ERROR] /usr/local/mysql/libexec/mysqld: The table ‘pre_common_session’ is full

最後更新：2017-01-04 22:34:54

服務器負載暴漲以後

上一篇： Oracle與MySQL的幾點區別

下一篇： Apache的曆史

相關內容

熱門內容

最新內容