請問隨便互聯網上的一個頁麵,像搜狗,搜搜是不是根據哪些技術來提取該頁麵的核心內容的
問題:請問隨便互聯網上的一個頁麵,像搜狗,搜搜是不是根據哪些技術來提取該頁麵的核心內容的?是不是根據權重標簽或者看到數量最多的關鍵詞
參考答案:
好比穀歌這種知名搜索引擎,數據庫裏會有容量很大的常用詞語資料庫和核心內容識別方法,會把所有每個資訊文字的標題,去數據庫比較,主要關鍵詞,網站段落文字等談得上該頁麵特性的東西來一一對比,從而計算出一篇獨立頁麵的核心內容。 如果僅僅是不是根據文章標題又或是主要的詞語,假如遭遇寫這些文字的編輯不嚴謹,或某意義不怎麼能表達的關鍵詞多次出現,進而判斷失效。
最後更新:2017-01-17 09:15:40