[問題] Beautifulsoup的問題

看板Python作者 (我是香民)時間11年前 (2014/03/10 11:04), 編輯推噓1(104)
留言5則, 2人參與, 最新討論串1/1
我在解析網頁時遇到某個欄位tag的層數不固定 可能的例子: 1.<div>範例</div> 2.<div><div>範例</div></div> 3.<div><div><p>範例</p></div></div> 想請問一下我要如何處理以上三種狀況,才能正確取出範例這兩個字? 只能用regular expression嗎? 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.163.118.235

03/10 12:09, , 1F
可以po一下代碼嗎? 我用BeautifulSoup.getText()就拿到
03/10 12:09, 1F
感謝你,我都是用像div.string這樣的程式碼 只能拿到一層的字串,遇到多層就不行了 ※ 編輯: kanako 來自: 118.163.118.235 (03/10 13:18)

03/11 01:45, , 2F
In [1]: from bs4 import BeautifulSoup
03/11 01:45, 2F

03/11 01:45, , 3F
In [2]: body = BeautifulSoup('<div><div><p>範例</p></d
03/11 01:45, 3F

03/11 01:45, , 4F
In [3]: body.text
03/11 01:45, 4F

03/11 01:46, , 5F
這樣抓不到媽?
03/11 01:46, 5F
文章代碼(AID): #1J7Ik_dC (Python)
文章代碼(AID): #1J7Ik_dC (Python)