閱讀667 返回首頁    go gooseeker集搜客


新浪微博數據采集攻略

新浪微博頁麵的組合采集攻略如下(綠框是頁麵名稱,橙色字體是采集結果表中的網址字段):

1、從“微博關鍵詞搜索結果”展開采集更多頁麵信息
微博關鍵詞.png
方法:從“微博關鍵詞搜索結果”的數據表中,把“博主主頁”這列的網址拷貝出來,然後點擊“微博博主主頁”的“輸入多條網址”按鈕,粘貼網址,就可以用後者實現批量數據采集。其它頁麵類似。


2、從“微博話題廣場”展開采集更多頁麵信息
微博話題.png
方法:從“微博話題廣場”的數據表中,把“博主主頁”這列的網址拷貝出來,然後點擊“微博博主主頁”的“輸入多條網址”按鈕,粘貼網址,就可以用後者實現批量數據采集。其它頁麵類似。

3、從“微博轉發&評論內容”展開采集更多頁麵信息
微博轉發.png
方法:從“微博轉發&評論內容”的數據表中,把“博主主頁”這列的網址拷貝出來,然後點擊“微博博主主頁”的“輸入多條網址”按鈕,粘貼網址,就可以用後者實現批量數據采集。其它頁麵類似。

4、從“微博粉絲與關注者資料”展開采集更多頁麵信息
微博粉絲.png方法:從“微博粉絲與關注者資料”的數據表中,把“主頁鏈接”這列的網址拷貝出來,然後點擊“微博博主主頁”的“輸入多條網址”按鈕,粘貼網址,就可以用後者實現批量數據采集。其它頁麵類似。

5、從“微博博主主頁”展開采集更多頁麵信息
微博博主.png方法:從“微博博主主頁”的數據表中,把“博文獨立網址”這列的網址拷貝出來,然後點擊“微博轉發&評論內容”的“輸入多條網址”按鈕,粘貼網址,就可以用後者實現批量數據采集。

【附注】
在數據DIY上可以找到很多網站下不同頁麵的采集入口,隻要與樣例網址是相同級別的網頁,就可以用該頁麵的采集入口采集數據。因此,如果從數據DIY某個頁麵采集到網址,那麼就可以找到該網址對應頁麵的采集入口,把批量網址添加進去,這也是數據DIY的出發點,讓用戶可以組合任意頁麵進行批量采集。


最後更新:2017-01-09 14:08:12

  上一篇:go 連續打碼:破解各種驗證碼連續采數據——以工商信息網為例 ... ...
  下一篇:go 熱門網站采集攻略