[問題] 關於爬蟲的一些問題
目前有需要在linkedin.com上爬資料
現在linkedin.com 防爬機制是不是超強啊。
怎麼做都會被擋
難道真的要購買代理池嗎(像是proxycurl)
還是程式真的有甚麼改法 比較不會擋
原本是用某個api 原本爬還可以 後來被擋
我知道是linkdin會防 非人類行為
也有用過滑鼠自動控制
像是我要爬取 https://www.linkedin.com/in/steve-michaels-ab099430/
裡的 person profile
experiment education license certifications
但目前爬完都會被封鎖帳號
有甚麼比較好的策略嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.215.37 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1776429962.A.14F.html
Python 近期熱門文章
PTT數位生活區 即時熱門文章