PTT數位生活區 / Python

[問題] lxml遇到<br /> 該如何處理?

看板Python作者girl5566 (5566520)時間10年前 (2016/03/14 23:06)推噓2(2推 0噓 3→)

留言5則, 3人參與討論串1/1

大家好最近想試著撰寫網頁爬蟲想抓取網頁的這部分資訊 http://imgur.com/rNdE4hh

嘗試的結果為 # -*- coding: utf-8 -*- from urllib2 import urlopen import xml.etree.ElementTree as ET from lxml import etree import mechanize import sys url = "http://www.tham.com.tw/recipe6.php" path = "//*[@id=\"left-inner\"]/div[2]/div[3]" html = urlopen(url).read() tree = etree.HTML(html) startindex = 4 data = tree.xpath(path) print data[0].text Output: >>> ================================ RESTART ================================ >>> 材料 2人份 >>> 看網頁的原始碼猜測是因為<br />阻擋了判斷的緣故請問這個有解嗎?? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.195.222.114 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1457968017.A.79E.html

推

03/15 00:37, , 1^F

03/15 00:37, 1^F

→

03/15 19:43, , 2^F

03/15 19:43, 2^F

請在請教一下 xpath這部分要怎麼debug? 有什麼秘訣嗎? 下面output也怪怪的 # -*- coding: utf-8 -*- from urllib2 import urlopen import xml.etree.ElementTree as ET from lxml import etree import mechanize import sys url = "https://icook.tw/recipes/133425" html = urlopen(url).read() tree = etree.HTML(html) path = "//*[@id=\"recipes_show\"]/div[3]" title = tree.xpath(path) print title Output: >>> [] ※ 編輯: girl5566 (123.195.222.114), 03/15/2016 20:24:59

推

03/16 20:18, , 3^F

03/16 20:18, 3^F

→

03/16 20:19, , 4^F

03/16 20:19, 4^F

→

03/16 20:19, , 5^F

03/16 20:19, 5^F

‣ 返回看板[ Python ] 程設

‣ 更多 girl5566 的文章

文章代碼(AID): #1MvjEHUU (Python)

Python 近期熱門文章

3

13

[問題] vscode的debug模式不用考慮中文路徑

2周前, 02/01

1

1

[問題] python 3.14 free thread build

3月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

3月前, 10/22

6

9

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

4月前, 10/09

4

21

[閒聊] Python 3.13 版本是不是很爛啊！？

7月前, 07/19

15

23

[閒聊] 各位現在用os.path 還是用pathlib.Path

7月前, 07/17

6

11

[閒聊] 2024年的自我python學習

7月前, 07/17

1

2

[問題] 用Whisper AI幫我下載字幕（有酬）

10月前, 04/01

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

6

7

[討論] 手機遊戲表現大橫評：廠商作弊太瘋狂！

6小時前, 02/16

11

12

[心得] 2026年耳機升級線總整理以及經驗分享

14小時前, 02/15

6

7

Re: [討論] 對岸很強的平板只有小米有國際版嗎

20小時前, 02/15

12

22

[問題] 拜託幫幫忙，媽媽無法自己轉換資料怎辦?

22小時前, 02/15

4

5

[家訪] 桃園大觀園:碳纖味MSB/管味海神AIC10

1天前, 02/15

3

13

[討論] 對岸很強的平板只有小米有國際版嗎

1天前, 02/14

15

26

[閒聊] 繞了一圈，你終究還是回到我身邊

[ PC_Shopping ]

1天前, 02/14

17

24

[新聞] 小手機真的回不來了！爆料：7吋寬比例螢幕成市場新方向

1天前, 02/14

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 girl5566 的文章

文章代碼(AID): #1MvjEHUU (Python)