閱讀719 返回首頁    go 阿裏雲 go 技術社區[雲棲]


[常識匯粹]利用robots.txt看到更多網頁

利用robots.txt看到更多網頁

 
Robots(也稱為爬蟲協議、機器人協議等)的全稱是“網絡爬蟲排除標準”(Robots Exclusion Protocol),網站通過Robots協議告訴搜索引擎哪些頁麵可以抓取,哪些頁麵不能抓取。
 
 
很多Web站的一部分內容,不是對外公開的,讀者也無法看到這些頁麵。實際上,我們完全可以利用robots.txt文件。
 
在瀏覽器地址欄中的網址後加上“/robots.txt”,你就可看到那些秘密網頁的文件或文件夾列表。此後,在地址欄直接鍵入這些網頁名,就可看到更多其他人看不到的網頁了。如下圖,直接在瀏覽器地址欄輸入下圖Disallow的地址,就可以訪問這個不公開的網頁了。
利用robots.txt看到更多網頁
 
 
 
以上利用robots.txt看到更多網頁內容出自幫助大全,感謝瀏覽~

最後更新:2017-04-08 11:49:38

  上一篇:go [BIOS設置]聯想K46\K47\E46\E47硬盤模式改IDE
  下一篇:go [係統幫助]內存不能為read的解決辦法