再問一個xpath怎麼下的問題
對Xpath還不是很熟 還想要再請教一下各位大大
以下面連結為例好了
https://www.ptt.cc/bbs/Boy-Girl/M.1413814957.A.704.html
我的需求是想要抓ptt裡本文的部分(作者po文 但不包含推噓文的部分)
以這個例來說會包含
白色字+ 綠色字+簽名檔的部分
我的想法是:
1.先找到可以包住整個po文以及推噓文的node集合(S)
//*[@id="main-content”]
2.然後定出終止的node(p)
/html/body/div[@id="main-container"]/div[@id="main-content"]/span[@class="f2" and text()="※ 文章網址:
“]
然後....就卡住了
我的問題是要怎麼下xpath 就可以直接在S裡抓出終止點之前所有的node啊?
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.218.124
※ 文章網址: http://www.ptt.cc/bbs/Python/M.1413881989.A.929.html
Python 近期熱門文章
PTT數位生活區 即時熱門文章