[問題] 使用 Python 爬蟲但一直會抓到重複的文字
請問各位
我使用以下的 code 想要爬一篇多頁面的Review網站文字
結果是可以爬出來,但每一頁的文字都會被重複爬取2~3次
造成最後爬出來的結果文字數量是超級爆炸多
想請問我的code 是哪邊有問題?
謝謝各位
code分享連結:
https://ideone.com/493g7j
爬取頁面:
https://reurl.cc/7K01b9
Note:
code裡面的 URL 我是使用動態產生的網址變數 "initial_url"
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 211.21.153.61 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1745138403.A.A5A.html
→
04/20 18:38,
5天前
, 1F
04/20 18:38, 1F
Python 近期熱門文章
PTT數位生活區 即時熱門文章
4
13