看板 [ RegExp ]
討論串[問題] 抓標籤內容的問題
共 3 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓1(1推 0噓 0→)留言1則,0人參與, 最新作者pinkisme時間17年前 (2008/06/09 11:53), 編輯資訊
1
0
0
內容預覽:
目前在抓標籤內容遇到一些問題. 比方說一個html內容某部分是下面這樣. <div>. this is div1. <div>. this is div2. </div>. <div>. this is div3. </div>. </div>. 請問該如何寫才能分別抓出div2和div3呢?. 謝

推噓1(1推 0噓 0→)留言1則,0人參與, 最新作者pinkisme時間17年前 (2008/06/11 01:51), 編輯資訊
1
0
0
內容預覽:
有照推文給的方式去抓,不過後來發現有點小問題,. 因為網頁內容有某些部分在div後面還有別的tag. 比如說. <div>. 1. <div>. <p>2. </div>. <div>. <p>3. </div>. 4. </div>. 有把推文的pattern更改去試. 不過還是抓不出來orz.

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者wawawa (哇哇哇○( ̄﹏ ̄)○)時間17年前 (2008/06/11 03:39), 編輯資訊
0
0
1
內容預覽:
你這問題其實我個人是覺得用 RE 有點苦幹. 如果巢狀架構都一樣那還好,但要是中間還會有不固定的標籤. 用 RE 有點苦 :p. 建議是使用專門分析 html tag 的模組去跑,比如若你用 python. 那就可以使用 Beautiful Soup [1] 之類的去分析,效果會好很多. 其他程式語
首頁
上一頁
1
下一頁
尾頁