PTT數位生活區 / Python

[問題] 請教爬蟲bs4如何去除標籤?

看板Python作者nini200 (200妮妮)時間7年前 (2018/12/25 23:29)推噓3(3推 0噓 4→)

留言7則, 3人參與討論串1/1

import requests from bs4 import BeautifulSoup import re url = 'https://tw.appledaily.com/new/realtime' res = requests.get(url) soup = BeautifulSoup(res.text,'lxml') tags = soup.find('ul',attrs={'class':'rtddd slvl'}) titles = tags.find_all('h1') for title in titles: print(title.text) 我爬蘋果日報標題 title.text 會將文字 <span>數字</span> 合併但我只想要文字部分數字不要請問如何提取呢感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.12.179.219 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1545751765.A.6F6.html

推

12/26 09:26, 7年前 , 1^F

12/26 09:26, 1^F

感謝回覆有試過但反而很多標題消失了 ※ 編輯: nini200 (114.33.71.129), 12/26/2018 20:29:52

→

12/26 23:32, 7年前 , 2^F

12/26 23:32, 2^F

看來只能用lxml 它的text()不會撈到旁邊span的數字

→

12/26 23:33, 7年前 , 3^F

12/26 23:33, 3^F

→

12/26 23:33, 7年前 , 4^F

12/26 23:33, 4^F

→

12/26 23:34, 7年前 , 5^F

12/26 23:34, 5^F

感謝^ ^

推

12/26 23:39, 7年前 , 6^F

12/26 23:39, 6^F

之前有試過 'NoneType' object has no attribute 'decompose' 但會報錯

推

12/26 23:44, 7年前 , 7^F

12/26 23:44, 7^F

有試過但很多標題都消失了 ※ 編輯: nini200 (114.33.71.129), 12/27/2018 00:45:45 ※ 編輯: nini200 (114.33.71.129), 12/27/2018 00:48:28

‣ 返回看板[ Python ] 程設

‣ 更多 nini200 的文章

文章代碼(AID): #1S8apLRs (Python)

Python 近期熱門文章

2

11

[問題] openpyxl到底能不能調整全局Font？

1月前, 05/07

7

21

[問題] super() 與MRO 鏈斷裂問題

3月前, 02/24

3

13

[問題] vscode的debug模式不用考慮中文路徑

4月前, 02/01

1

15

[問題] skimage.io.imread()讀圖檔底色是黃色？

5月前, 12/28

2

4

[閒聊] 有人要合購股票pythony資料庫finlab嗎?

5月前, 12/23

1

1

[問題] python 3.14 free thread build

7月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

7月前, 10/22

6

9

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

8月前, 10/09

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

6

9

[開箱] 淘寶啟動！瀚鎧 RX9070 GRE 合金

[ PC_Shopping ]

1小時前, 06/15

2

14

Re: [討論] 對岸已有測評被依網路規範要求道歉

4小時前, 06/15

6

13

[問題] S25 Ultra 後蓋這樣算膨脹嗎？

5小時前, 06/15

7

27

[問題] A7C2是否要換成A7R5

6小時前, 06/15

15

99

Re: [討論] 對岸已有測評被依網路規範要求道歉

7小時前, 06/15

4

20

[問題] 遊戲移動視角的撕裂感換144Hz可以改善嗎?

[ Digitalhome ]

8小時前, 06/15

6

42

Re: [討論] 對岸已有測評被依網路規範要求道歉

8小時前, 06/15

2

6

[問題] ios 27 beta的line

13小時前, 06/15

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 nini200 的文章

文章代碼(AID): #1S8apLRs (Python)