PTT數位生活區 / Python

[問題] 請問抓網頁標籤有哪些推薦的 lib

看板Python作者FreedomMax (FreedomKnight)時間13年前 (2013/01/10 02:15)推噓5(5推 0噓 6→)

留言11則, 7人參與討論串1/1

今天我試著要用 HTMLParser 去抓網頁的標籤可是我怎麼覺得 HTMLParser 也根本還是土法煉鋼呀? 他頂多是幫忙了拆掉角括弧還有幫我記錄 tag_name tag_attr 之類的可是好像無法直接抓 tag id 去對照裡面的資料我今天有用了一會 Beautiful Soup 很不賴，還會幫我做tree 還可以用 find 去找 tag 不過對他們用的結構還是有點不太了解，以為 find 到了還可以找到他的 sub tag 跟 sibling 這種 parser 好像比較好用，所以我查了一下 lxml 好像也可以抓 html 不知道兩者之間如何，還有我是否誤會了 HTMLParser 該不會其實還需要搭配內建的 xml parser? (還有個小需求， support python3 佳) -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.34.40.224

→

01/10 08:08, , 1^F

01/10 08:08, 1^F

→

01/10 08:11, , 2^F

01/10 08:11, 2^F

推

01/10 09:53, , 3^F

01/10 09:53, 3^F

→

01/10 09:54, , 4^F

01/10 09:54, 4^F

→

01/10 11:33, , 5^F

01/10 11:33, 5^F

→

01/10 23:54, , 6^F

01/10 23:54, 6^F

推

01/11 12:55, , 7^F

01/11 12:55, 7^F

→

01/11 15:35, , 8^F

01/11 15:35, 8^F

推

01/12 14:34, , 9^F

01/12 14:34, 9^F

推

01/12 14:38, , 10^F

01/12 14:38, 10^F

推

01/18 14:28, , 11^F

01/18 14:28, 11^F

‣ 返回看板[ Python ] 程設

‣ 更多 FreedomMax 的文章

文章代碼(AID): #1GxREiBd (Python)

Python 近期熱門文章

2

11

[問題] openpyxl到底能不能調整全局Font？

1月前, 05/07

7

21

[問題] super() 與MRO 鏈斷裂問題

3月前, 02/24

3

13

[問題] vscode的debug模式不用考慮中文路徑

4月前, 02/01

1

15

[問題] skimage.io.imread()讀圖檔底色是黃色？

5月前, 12/28

2

4

[閒聊] 有人要合購股票pythony資料庫finlab嗎?

5月前, 12/23

1

1

[問題] python 3.14 free thread build

7月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

7月前, 10/22

6

9

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

8月前, 10/09

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

7

11

[心得] [心得]SONY XPERIA 1 VIII 簡短拍照感受

1小時前, 06/15

0

8

[討論] 哪個廠牌型號會自動下載APP？

1小時前, 06/15

12

29

Re: [閒聊] NordVPN軟體bug導致SSD壽命歸零

[ PC_Shopping ]

3小時前, 06/15

13

20

[開箱] 淘寶啟動！瀚鎧 RX9070 GRE 合金

[ PC_Shopping ]

4小時前, 06/15

2

16

[選購] 無線鍵盤VS有線鍵盤都幾？

[ Key_Mou_Pad ]

5小時前, 06/15

2

15

Re: [討論] 對岸已有測評被依網路規範要求道歉

7小時前, 06/15

5

21

[問題] S25 Ultra 後蓋這樣算膨脹嗎？

8小時前, 06/15

10

33

[問題] A7C2是否要換成A7R5

9小時前, 06/15

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 FreedomMax 的文章

文章代碼(AID): #1GxREiBd (Python)