[問題] 使用 Python 爬蟲但一直會抓到重複的文字

看板Python作者 (No)時間5天前 (2025/04/20 16:40), 編輯推噓0(001)
留言1則, 1人參與, 5天前最新討論串1/1
請問各位 我使用以下的 code 想要爬一篇多頁面的Review網站文字 結果是可以爬出來,但每一頁的文字都會被重複爬取2~3次 造成最後爬出來的結果文字數量是超級爆炸多 想請問我的code 是哪邊有問題? 謝謝各位 code分享連結: https://ideone.com/493g7j 爬取頁面: https://reurl.cc/7K01b9 Note: code裡面的 URL 我是使用動態產生的網址變數 "initial_url" -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 211.21.153.61 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1745138403.A.A5A.html

04/20 18:38, 5天前 , 1F
你可能要限制只抓 div class='entry' 裡的所有 p
04/20 18:38, 1F
文章代碼(AID): #1e1BBZfQ (Python)
文章代碼(AID): #1e1BBZfQ (Python)