PTT數位生活區 / Python

[問題] 爬蟲剔除不必要標籤

看板Python作者m87dd05 (八八里阿巴)時間7年前 (2019/03/12 10:57)推噓3(3推 0噓 1→)

留言4則, 3人參與討論串1/1

小弟是爬蟲新手想請問各位前輩我目前已經針對網頁爬到如附圖之資訊了(利用 find + find_all 搭配for迴圈) 使用find_all("th", attrs={"data-XXXXXX: ""}) 最後可以爬到如下圖之資訊 https://imgur.com/a/8FTeXMM 但因<th>包住<span>，但<span>的內容我不需要，我只需要 Time 試過如果我在這個時候直接print find_all("th", attrs={"data-XXXXXX: ""}).text 會得到 ---------- Time (S) ---------- 想請問: (1) 以目前狀態來看我是不是只能自己去處理 Time 換行 (s) 的這串資料，可能自己剔除換行符號之後的資訊? (2) 有沒有更好的解法可以直接拿到 Time呢? find_all("th", attrs={"data-XXXXXX: ""}) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.249.60.124 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1552359457.A.082.html

推

03/12 11:33, 7年前 , 1^F

03/12 11:33, 1^F

→

03/12 11:33, 7年前 , 2^F

03/12 11:33, 2^F

推

03/12 13:57, 7年前 , 3^F

03/12 13:57, 3^F

推

03/12 22:26, 7年前 , 4^F

03/12 22:26, 4^F

‣ 返回看板[ Python ] 程設

‣ 更多 m87dd05 的文章

文章代碼(AID): #1SXo0X22 (Python)

Python 近期熱門文章

2

11

[問題] openpyxl到底能不能調整全局Font？

1月前, 05/07

7

21

[問題] super() 與MRO 鏈斷裂問題

3月前, 02/24

3

13

[問題] vscode的debug模式不用考慮中文路徑

4月前, 02/01

1

15

[問題] skimage.io.imread()讀圖檔底色是黃色？

5月前, 12/28

2

4

[閒聊] 有人要合購股票pythony資料庫finlab嗎?

5月前, 12/23

1

1

[問題] python 3.14 free thread build

7月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

7月前, 10/22

6

9

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

8月前, 10/09

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

4

10

[閒聊] 中國廠商用網路規範對測評博主大清算

[ PC_Shopping ]

1小時前, 06/15

1

14

[問題] 買二手機/福利品推薦網購還是實體店？

5小時前, 06/15

0

16

[菜單] 36K遊戲機

[ PC_Shopping ]

7小時前, 06/14

11

18

[心得]FUNTE 升降桌過保維修過程紀錄(圖多)

[ PC_Shopping ]

8小時前, 06/14

5

9

[情報] Sennheiser HD26pro 屎低

10小時前, 06/14

3

23

[購機] 預算40k 日常拍照 AI

11小時前, 06/14

3

44

[閒聊] 電供和主機板會隨著配件老化而衝突嗎

[ PC_Shopping ]

11小時前, 06/14

4

10

[問題] oneUI8.5鍵盤下方的白色留空

11小時前, 06/14

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 m87dd05 的文章

文章代碼(AID): #1SXo0X22 (Python)