[討論] 一個表示式的健檢
看板RegExp (正規表示式 Regular Expression)作者m2251000 (akakaze 二兵 >)時間9年前 (2015/04/25 01:40)推噓2(2推 0噓 5→)留言7則, 2人參與討論串1/1
小弟我想要抓取一個具有固定class的div裡面所有的東西
而因為網頁不同,這個div標籤裡頭也有數量不一的其他的div標籤
為了避免截斷在錯誤的結尾標籤,我的想法是將裡面的div標籤都配對
也就是每碰到一個<div>就配給一個</div>,直到碰到對的那個
再經過各種亂湊(?)實驗之後
最成功的是下面這個
/<div class="c_1"[\s\S]+?>(?:(?:<div[\s\S]+?>[\s\S]+?<\/div>)*[\s\S]+?)+?<\/div>/
雖然實驗成功了,不過還是想請問一下
這樣的寫法會有什麼不好的bug嗎?
有什麼需要改進的地方呢?
或是有更簡潔的方式達到我的需求呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.33.36.91
※ 文章網址: https://www.ptt.cc/bbs/RegExp/M.1429897240.A.948.html
推
04/25 02:02, , 1F
04/25 02:02, 1F
→
04/25 02:03, , 2F
04/25 02:03, 2F
→
04/25 02:03, , 3F
04/25 02:03, 3F
→
04/25 02:04, , 4F
04/25 02:04, 4F
→
04/25 02:04, , 5F
04/25 02:04, 5F
→
04/25 02:04, , 6F
04/25 02:04, 6F
推
05/04 00:34, , 7F
05/04 00:34, 7F
RegExp 近期熱門文章
PTT數位生活區 即時熱門文章