閱讀444 返回首頁    go 百度 go 站長平台


Sitemap工具幫助

一、什麼是Sitemap?

Sitemap(即站點地圖)就是您網站上各網頁的列表。創建並提交Sitemap有助於百度發現並了解您網站上的所有網頁。您還可以使用Sitemap提供有關您網站的其他信息,如上次更新日期、Sitemap文件的更新頻率等,供百度Spider參考。

百度對已提交的數據,不保證一定會抓取及索引所有網址。但是,我們會使用Sitemap中的數據來了解網站的結構等信息,這樣可以幫助我們改進抓取策略,並在日後能更好地對網站進行抓取。

此外,Sitemap 與搜索排名沒有關係。 

 二、百度Sitemap協議都支持哪些格式?

百度Sitemap協議支持三種格式:文本格式、xml格式、Sitemap索引格式,可以根據自己情況來選擇任意一種格式組織sitemap。   

具體格式說明及示例如下: 

1.第一種格式樣例:txt文本格式

    在一個txt文本列明需要向百度提交的鏈接地址,將txt文本文件通過站長平台進行提交    

          https://www.example.com/repaste/101562698_5230191316.html
          https://www.example.com/repaste/101586283_5230215075.html
          https://www.example.com/repaste/101639435_5230310576.html
  

    此文本文件需要遵循以下指南:

  • 文本文件每行都必須有一個網址。網址中不能有換行。不應包含網址列表以外的任何信息。                       

  • 您必須書寫完整的網址,包括 http。

  • 每個文本文件最多可包含 50,000 個網址,並且應小於10MB(10,485,760字節)。如果網站所包含的網址超過 50,000 個,則可將列表分割成多個文本文件,然後分別添加每個文件。

  • 文本文件需使用 UTF-8 編碼或GBK編碼。                                                              

    2.第二種格式樣例:xml格式

    您先了解單個xml數據格式如下:

<?xml  version="1.0" encoding="utf-8"?>
XML文件需以utf-8編碼
<urlset>
必填,這是整個鏈接集合的定義入口,以<urlset>作為開始,</urlset>作為結束
<url>
必填,這是具體某一個鏈接的定義入口,每一條數據都要用<url>和</url>包含在裏麵。
<loc>https://www.yoursite.com/yoursite.html</loc>
必填,頁麵鏈接地址,長度不得超過256字節。
<lastmod>2009-12-14</lastmod>
選填,用來指定該鏈接的最後更新時間
<changefreq>daily</changefreq>
選填,用這個標簽告訴此鏈接可能會出現的更新頻率
<priority>0.8</priority>
選填,可以不提交該標簽,用來指定此鏈接相對於其他鏈接的優先權比值,此值定於0.0-1.0之間
</url>必填,標簽閉合
</urlset>
必填,標簽閉合

    上述xml sitemap向百度提交了一個url:https://www.yoursite.com/yoursite.html 

    若有多條url,按照上述格式重複<url></url>之間的片斷,列明所有url地址,打包到一個xml文件,向站長平台進行提交。

    3.第三種格式樣例:Sitemap索引格式

如需提交大量sitemap文件,則可將其列在sitemap索引文件中,然後將該索引文件提交。您無需分別提交每個文件。

<?xml version="1.0"  encoding="UTF-8" ?> 
XML文件需以utf-8編碼
<sitemapindex>
必填,以 <sitemapindex> 開始標記作為開始,以 </sitemapindex> 結束標記作為結束
<sitemap>
必填,以<sitemap>標簽提交一個子sitemap文件
<loc>https://example.com/ext/xmlsitemap/add/201201/index_20120106.xml</loc>必填,識別sitemap的位置
<lastmod>2012-01-06</lastmod>
選填,識別相對sitemap文件的修改時間
</sitemap>
必填,標簽閉合
</sitemapindex>
必填,標簽閉合

有多個sitemap,按上述格式重複<sitemap></sitemap>之間的片斷,列明所有sitemap地址,向站長平台進行提交。

三、創建sitemap時有哪些注意事項?

  • 一個sitemap文件包含的網址不得超過 5 萬個,且文件大小不得超過 10 MB。如果您的sitemap超過了這些限值,請將其拆分為幾個小的sitemap。這些限製條件有助於確保您的網絡服務器不會因提供大文件而超載。

  • 一次性最多提交50個地址,提交地址的文件類型和更新周期必須一致。

  • 如果驗證了網站的主域,那麼Sitemap文件中可包含該網站主域下的所有網址。

  • 如果驗證的www.example.com,你隻能提交該驗證網站的網址,不能出現其他網站的網址。

四、如何提交sitemap?

第一步,將需提交的網頁列表製作成一個sitemap文件,文件格式請閱讀百度sitemap協議都支持哪些格式。

第二步,將sitemap文件放置在網站目錄下。

比如您的網站為example.com,您已製作了一個sitemap_example.xml的sitemap文件,將sitemap_example.xml上傳至網站根目錄即example.com/sitemap_example.xml

第三步,登錄百度站長平台,確保提交sitemap數據的網站已驗證歸屬。

第四步,進入sitemap工具,點擊“添加新數據”,文件類型選擇“URL列表”,填寫抓取周期和sitemap文件地址(如:www.example.com/sitemap_example.xml),進行提交。


提交完之後,可在sitemap列表裏看到提交的sitemap文件,如果sitemap文件裏麵有新的網站鏈接,可以選擇文件後,點擊更新所選,即對更新的網站鏈接進行了提交。

整體流程如下圖: 


五、我提交時填寫的周期是什麼含義?

百度spider會參考設置周期抓取sitemap文件,因此請根據sitemap文件內容的更新(比如增加新url)來設置。

請注意若url不變而僅是url對應的頁麵內容更新(比如論壇帖子頁有新回複內容),不在此更新範圍內。sitemap工具不能解決頁麵更新問題。

六、sitemap提交後,多久能被百度處理?

sitemap數據提交後,一般在1小時內百度會開始處理。處理完成的時間視文件大小和您設置的抓取周期而定。

七、提交的sitemap都會被百度抓取並收錄嗎?

百度對已提交的數據,不保證一定會抓取及收錄所有網址。是否收錄與頁麵質量相關。

八、我可以壓縮我的 Sitemap 嗎?它們是否需要用 gzip 壓縮?

可以。請使用 gzip 壓縮 Sitemap。無論壓縮與否,Sitemap 應該小於 10MB(10,485,759字節)。

九、XML格式的 Sitemap 中,“priority”提示會影響我的網頁在搜索結果中的排名嗎?

不會。Sitemap 中的“priority”提示隻是說明該網址相對於您自己網站上其他網址的重要性,並不會影響網頁在搜索結果中的排名。

十、網址在 Sitemap 中的位置是否會影響它的使用?

不會。網址在 Sitemap 中的位置並不會影響百度對它的識別或使用方式。

十一、Sitemap中提交的url能否包含中文?

因為轉碼問題建議最好不要包含中文。


最後更新:2013-07-22 13:24:39

  上一篇:go 網站改版工具幫助
  下一篇:go 百度索引量工具幫助