[問題] 求救解析HTML
看板RegExp (正規表示式 Regular Expression)作者areyo (沒有名字的怪物)時間12年前 (2012/08/17 20:40)推噓2(2推 0噓 5→)留言7則, 3人參與討論串1/1
大家晚安
小弟使用的是python 2.6的正規
現在在練習解析一個網頁中某段資料如下
<h2>Department</h2>
<ul id="ref_3224438011">
<li style="margin-left: -18px"><a href="‹ http://www.amazon.com/s?ie=UTF8&page=1&rh=n%3A172282">‹ <span class="expand">Electronics</span></a></li>
<li style="margin-left: -10px"><a href="‹ http://www.amazon.com/s?ie=UTF8&page=1&rh=n%3A281407">‹ <span class="expand">Accessories & Supplies</span></a></li>
<li style="margin-left: -2px"><a href="‹ http://www.amazon.com/s?ie=UTF8&page=1&rh=n%3A172532">‹ <span class="expand">Audio & Video Accessories</span></a></li>
<li style="margin-left: 24px"><strong>3D Glasses</strong></li>
</ul>
我想從一個完整的html中抓出這一段
我試著用線上正規檢查去試,只有土法鍊鋼出這段REG
<h2>.+\n.+\n.+\n.+\n.+\n.+\n<\/ul>
發現中間都是用.+\n不斷重覆,但是卻不知道有幾層,有人可指點迷津嗎?
感恩
--
懶惰與懦弱使愚笨成自然
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.40.188.253
推
08/17 20:58, , 1F
08/17 20:58, 1F
→
08/17 21:06, , 2F
08/17 21:06, 2F
→
08/17 21:47, , 3F
08/17 21:47, 3F
→
08/17 21:48, , 4F
08/17 21:48, 4F
→
08/17 21:49, , 5F
08/17 21:49, 5F
→
08/17 21:49, , 6F
08/17 21:49, 6F
推
08/18 12:58, , 7F
08/18 12:58, 7F
RegExp 近期熱門文章
PTT數位生活區 即時熱門文章