[問題] 加速Python爬蟲速度
大家好,我們想要把ISBN上2014到2024的書籍資料全部用爬蟲爬出來,可是使用selenium
寫出爬蟲程式(程式如下附連結,寫得有點冗不好意思)後,發現爬每一筆資料都要花大約
8秒鐘,這樣如果要爬十年資料會爬不完(大約要花1400小時)。 所以想請教有甚麼爬蟲爬
得比較快的寫法嗎? 感謝!
https://drive.google.com/drive/folders/1pMXmZaob-qAh4VTXlcLReCv6W072NHPC?usp=s
haring
目前有使用https://scrapeops.io/selenium-web-scraping-playbook/python-selenium
disable-image-loading/,讓它不要讀取圖片只讀取文字,有快了一些些但還是6秒左右
,用requests寫好像也會比較快?但還是想詢問有沒有更快速的Python爬法,因為我們的
時間不夠多,謝謝板上的各位!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.241.164 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1704477043.A.325.html
※ 編輯: jianingtw (114.136.241.164 臺灣), 01/06/2024 01:52:02
→
01/06 02:07,
11月前
, 1F
01/06 02:07, 1F
→
01/06 02:08,
11月前
, 2F
01/06 02:08, 2F
→
01/06 02:08,
11月前
, 3F
01/06 02:08, 3F
→
01/08 15:57,
11月前
, 4F
01/08 15:57, 4F
→
01/08 15:58,
11月前
, 5F
01/08 15:58, 5F
→
01/08 15:59,
11月前
, 6F
01/08 15:59, 6F
→
01/08 16:00,
11月前
, 7F
01/08 16:00, 7F
→
01/08 16:00,
11月前
, 8F
01/08 16:00, 8F
→
01/13 00:42,
11月前
, 9F
01/13 00:42, 9F
→
01/13 00:43,
11月前
, 10F
01/13 00:43, 10F
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章