ICO算法是對已經入索引庫的低質量URL和無效URL數據進行清理的算法,在不同的階段會對不同類型的無效數據進行清理,該算法是一個長期執行的算法。(ICO 全稱:Index clear optimize)
算法公布規範:一次清理超過10億頁麵的算法360搜索都將提前公布告知站長,並告知算法優化處理的主要方向。
938
360搜索
ICO算法是對已經入索引庫的低質量URL和無效URL數據進行清理的算法,在不同的階段會對不同類型的無效數據進行清理,該算法是一個長期執行的算法。(ICO 全稱:Index clear optimize)
算法公布規範:一次清理超過10億頁麵的算法360搜索都將提前公布告知站長,並告知算法優化處理的主要方向。
處理量級:10億以上
處理網頁特點:
該算法主要是針對重複內容進行清理,對用戶沒有價值的內容頁麵,內容時效性強且過期的頁麵,采集站類,URL地址含有無效參數的頁麵等。
例如:招聘類網站不同子站中內容相同的頁麵,小說采集站尤其處理對用戶無價值的頁麵,舊新聞頁且內容重複的頁麵也會處理一部分,以及其他的部分無效頁麵。
2014-05-30
最後更新:2016-12-26 22:42:48