PTT數位生活區 / Python

[問題] BeautifulSoup處理超連結的問題

看板Python作者BM0108 (衝)時間14年前 (2011/05/22 12:48)推噓4(4推 0噓 9→)

留言13則, 3人參與討論串1/1

各位前輩好我要用BeautifulSoup處理一段表格html，然後把表格橫軸和縱軸的相對應資料轉存成json 我大致已經完成，不過若表格中的內容有超連結，會碰上一些問題，例如： html=""" <td><a href="https://ceiba.ntu.edu.tw/992nihonkingendai378" target="_blank">日本近現代史二</a> <br />History of Modern Japan(Ⅱ)</td> """ html = html.split() #這時候html裡的東西會被存成list；不過a、href這兩個應該要在一起的東西因為中間有 #空格的關係，分別被存在不同的位置，我猜這可能是接下來會出錯的原因 soup = BeautifulSoup(''.join(html)) print soup #<td><ahref>日本近現代史二 <br />History of Modern Japan(Ⅱ)</ahref></td> #這時候連結會被吃掉、<a>標籤自動被改成<ahref> print soup.td.string #這時候按理說會把<td></td>之間的內容轉成string並回傳，但事實上卻回傳None 請問要怎麼解決這樣的問題呢？另外，"&nbsp"這個html碼該怎麼處理掉？我有大致把BeautifulSoup的Documentation瀏覽過了，但還是找不到對策..... 懇請高手指點一下，感激！ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.161.124.104 ※ 編輯: BM0108 來自: 218.161.124.104 (05/22 12:48)

推

05/22 16:30, , 1^F

05/22 16:30, 1^F

推

05/22 16:32, , 2^F

05/22 16:32, 2^F

→

05/22 16:35, , 3^F

05/22 16:35, 3^F

推

05/24 17:31, , 4^F

05/24 17:31, 4^F

推

05/25 13:49, , 5^F

05/25 13:49, 5^F

→

05/25 13:51, , 6^F

05/25 13:51, 6^F

→

05/25 13:51, , 7^F

05/25 13:51, 7^F

→

05/25 13:54, , 8^F

05/25 13:54, 8^F

→

05/25 14:34, , 9^F

05/25 14:34, 9^F

→

05/25 14:34, , 10^F

05/25 14:34, 10^F

→

05/25 14:35, , 11^F

05/25 14:35, 11^F

→

05/25 14:35, , 12^F

05/25 14:35, 12^F

→

05/26 23:23, , 13^F

05/26 23:23, 13^F

‣ 返回看板[ Python ] 程設

‣ 更多 BM0108 的文章

文章代碼(AID): #1Ds9MVUN (Python)

Python 近期熱門文章

1

1

[問題] python 3.14 free thread build

1周前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

2周前, 10/22

4

7

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

4周前, 10/09

4

21

[閒聊] Python 3.13 版本是不是很爛啊！？

3月前, 07/19

14

22

[閒聊] 各位現在用os.path 還是用pathlib.Path

3月前, 07/17

5

10

[閒聊] 2024年的自我python學習

3月前, 07/17

1

2

[問題] 用Whisper AI幫我下載字幕（有酬）

7月前, 04/01

1

3

[問題] selenium 有辦法做檔案上傳嗎?

9月前, 02/03

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

7

12

[新聞] 日本iPhone用戶也解放了！蘋果將開放第

3小時前, 11/08

3

13

[情報] 微軟:未來將改善Win11的右鍵選單排列布局

[ PC_Shopping ]

3小時前, 11/08

8

29

[心得] Apple Intelligence 已關閉

7小時前, 11/08

8

28

[閒聊] 從預購B850MPOWER 微星把台灣當作次等

[ PC_Shopping ]

7小時前, 11/08

5

38

[菜單] 40K 白色遊戲機

[ PC_Shopping ]

9小時前, 11/07

8

15

[開箱] My AMD Power 微星MSI B850 MPOWER超頻MB

[ PC_Shopping ]

10小時前, 11/07

8

17

[情報] Vivo Y500 Pro 採用2億像素 HP5主攝

10小時前, 11/07

5

23

[討論] 一號多機（手錶）每月多收費合理嗎？

11小時前, 11/07

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 BM0108 的文章

文章代碼(AID): #1Ds9MVUN (Python)