667
gooseeker集搜客
新浪微博數據采集攻略
新浪微博頁麵的組合采集攻略如下(綠框是頁麵名稱,橙色字體是采集結果表中的網址字段):1、從“微博關鍵詞搜索結果”展開采集更多頁麵信息

方法:從“微博關鍵詞搜索結果”的數據表中,把“博主主頁”這列的網址拷貝出來,然後點擊“微博博主主頁”的“輸入多條網址”按鈕,粘貼網址,就可以用後者實現批量數據采集。其它頁麵類似。
2、從“微博話題廣場”展開采集更多頁麵信息

方法:從“微博話題廣場”的數據表中,把“博主主頁”這列的網址拷貝出來,然後點擊“微博博主主頁”的“輸入多條網址”按鈕,粘貼網址,就可以用後者實現批量數據采集。其它頁麵類似。
3、從“微博轉發&評論內容”展開采集更多頁麵信息

方法:從“微博轉發&評論內容”的數據表中,把“博主主頁”這列的網址拷貝出來,然後點擊“微博博主主頁”的“輸入多條網址”按鈕,粘貼網址,就可以用後者實現批量數據采集。其它頁麵類似。
4、從“微博粉絲與關注者資料”展開采集更多頁麵信息

5、從“微博博主主頁”展開采集更多頁麵信息

【附注】
在數據DIY上可以找到很多網站下不同頁麵的采集入口,隻要與樣例網址是相同級別的網頁,就可以用該頁麵的采集入口采集數據。因此,如果從數據DIY某個頁麵采集到網址,那麼就可以找到該網址對應頁麵的采集入口,把批量網址添加進去,這也是數據DIY的出發點,讓用戶可以組合任意頁麵進行批量采集。
最後更新:2017-01-09 14:08:12