Re: [問題] 抓標籤內容的問題

看板RegExp (正規表示式 Regular Expression)作者 (哇哇哇○( ̄﹏ ̄)○)時間17年前 (2008/06/11 03:39), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串3/3 (看更多)
※ 引述《pinkisme ()》之銘言: : ※ 引述《pinkisme ()》之銘言: : 比如說 : <div> : 1 : <div> : <p>2 : </div> : <div> : <p>3 : </div> : 4 : </div> : 有把推文的pattern更改去試 : 不過還是抓不出來orz 你這問題其實我個人是覺得用 RE 有點苦幹 如果巢狀架構都一樣那還好,但要是中間還會有不固定的標籤 用 RE 有點苦 :p 建議是使用專門分析 html tag 的模組去跑,比如若你用 python 那就可以使用 Beautiful Soup [1] 之類的去分析,效果會好很多 其他程式語言也有類似的東西可以使用,找找看就會有... [1] http://www.crummy.com/software/BeautifulSoup/ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.104.141.2
文章代碼(AID): #18JjXrLH (RegExp)
討論串 (同標題文章)
文章代碼(AID): #18JjXrLH (RegExp)