淺談404問題
作者:百度站長平台lee 發布時間:2013年5月3日
今天為什麼要說一下404問題呢,最近看case過程中發現個很有意思的網站,該網站被灌了大量的垃圾信息,被其發現後及時地進行了刪除,這一點是值得肯定的。通常情況下,正常網站將自動返回404狀態碼,搜索引擎進行更新並刪除,避免對網站用戶及搜索引擎帶來負麵影響。但問題來了,該網站隻刪除了內容,沒有任何主體內容的頁麵被保存了下來,未做404處理。當然,存在一類網站隻刪除內容後返回正常200狀態碼,提醒一句“該內容已刪除”,但其都沒有。可以發現目前這個搜藏中的url仍然正常返回200,https://cang.baidu.com/Lee/snap/3b0a0cc8e7d7899facd36fad.html,造成的後果:搜索引擎將花費大量的資源在這種無效頁麵上,那麼,同等耗損下用在重要頁麵上的資源將被大量擠占,可想而知,正常優質頁麵在搜索引擎的部分表現將受到影響。經過我們運營同學的多方溝通下至今仍未進一步處理。我覺得,21世紀第二個十年了,這種問題不應該再存在了的。
好吧,承認我被打敗了。簡單說一下:
404狀態碼代表‘Not Found’,spider更新時會認為該頁麵已失效,此時呢將在索引庫中刪除,短期內spider再次發現該url不再會抓取。因此,出來了兩類問題:第一,網頁臨時性打不開;第二,頁麵永遠無法打開。針對第一類問題,我建議不要立刻返回404,而是使用503。503等同於告訴spider該頁麵臨時訪問不了,過段時間再來光臨。關於503,spider會認為該網頁臨時無法訪問,短期內會再光臨。如果網頁已經恢複,即刻正常抓取;如果繼續返回503,短期內還會再光臨幾次,但如果該頁麵長時間返回503,該url仍會被認作失效鏈接,從索引庫中刪除。針對第二類問題,永遠無法打開的頁麵,404,不用考慮。各種web2類頁麵刪除後同樣需要返回404告知搜索引擎該頁麵已失效。
回歸之前那個網站,刪除內容後該頁麵沒有任何價值。最恰當的處理是:
1、直接做死鏈處理並返回404;
2、在百度站長平台死鏈提交工具中提交死鏈sitemap。
最後呢,提醒一下各位站長朋友,當您的網站存在被發布大量垃圾信息時,請:
1、及時刪除相關垃圾頁麵,並做404處理;
2、製作符合要求的死鏈sitemap;
3、登錄百度站長平台,進入死鏈提交工具提交死鏈sitemap。
最後更新:2013-07-19 06:52:43