PTT
數位生活區
即時熱門文章
24小時內熱門文章
最新文章
熱門看板
看板列表
我的收藏
最近瀏覽
批踢踢 PTT 搜尋引擎
看板
[
RegExp
]
討論串
[問題] 抓標籤內容的問題
共 3 篇文章
排序:
最舊先
|
最新先
|
留言數
|
推文總分
內容預覽:
開啟
|
關閉
|
只限未讀
首頁
上一頁
1
下一頁
尾頁
#1
[問題] 抓標籤內容的問題
推噓
1
(1推
0噓 0→
)
留言
1則,0人
參與
,
最新
作者
pinkisme
時間
17年前
發表
(2008/06/09 11:53)
,
編輯
資訊
1篇文章回應此文
1
內文有0個圖片
image
0
內文有0個連結
link
0
內容預覽:
目前在抓標籤內容遇到一些問題. 比方說一個html內容某部分是下面這樣. <div>. this is div1. <div>. this is div2. </div>. <div>. this is div3. </div>. </div>. 請問該如何寫才能分別抓出div2和div3呢?. 謝
#2
Re: [問題] 抓標籤內容的問題
推噓
1
(1推
0噓 0→
)
留言
1則,0人
參與
,
最新
作者
pinkisme
時間
17年前
發表
(2008/06/11 01:51)
,
編輯
資訊
1篇文章回應此文
1
內文有0個圖片
image
0
內文有0個連結
link
0
內容預覽:
有照推文給的方式去抓,不過後來發現有點小問題,. 因為網頁內容有某些部分在div後面還有別的tag. 比如說. <div>. 1. <div>. <p>2. </div>. <div>. <p>3. </div>. 4. </div>. 有把推文的pattern更改去試. 不過還是抓不出來orz.
#3
Re: [問題] 抓標籤內容的問題
推噓
0
(0推
0噓 0→
)
留言
0則,0人
參與
,
最新
作者
wawawa
(哇哇哇○( ̄﹏ ̄)○)
時間
17年前
發表
(2008/06/11 03:39)
,
編輯
資訊
0篇文章回應此文
0
內文有0個圖片
image
0
內文有1個連結
link
1
內容預覽:
你這問題其實我個人是覺得用 RE 有點苦幹. 如果巢狀架構都一樣那還好,但要是中間還會有不固定的標籤. 用 RE 有點苦 :p. 建議是使用專門分析 html tag 的模組去跑,比如若你用 python. 那就可以使用 Beautiful Soup [1] 之類的去分析,效果會好很多. 其他程式語
首頁
上一頁
1
下一頁
尾頁