[問題] 如何消除html tag

看板Perl作者 (None)時間16年前 (2009/04/03 00:52), 編輯推噓0(004)
留言4則, 1人參與, 最新討論串1/2 (看更多)
關於這個問題 我知道可以用正規式直接去實做 但是對於正規式的使用還沒有很透徹的了解 想問看看是否有相關的HTML module可以把html tag消除掉 只留下tag跟tag中的內容 (有到cpan網站中去找 但是資料過於龐大 找得很沒頭緒) 或者有人可以跟我講 如何利用正規式去實做嗎? 有查到可用<(.| )*?>去消除所有的HTML Tag 但是消除後的文字Home與Test連在一起....希望能做到分開的效果 或者是結果儲存在一個陣列當中 謝謝 HTML Example: <a href="HomeTest" rel="nofollow">http://127.0.0.1">Home<span>Test</span></a> 須將Home跟Test抓出來 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.232.66.53

04/03 01:53, , 1F
1904篇看看也許有點幫助..我用HTML::TreeBuilder清除所有
04/03 01:53, 1F

04/03 01:53, , 2F
tag...這個模組算清的蠻乾淨的
04/03 01:53, 2F

04/03 02:11, , 3F
HTML::Strip也可,把那串文字存成txt檔,讀進來用HTML::
04/03 02:11, 3F

04/03 02:12, , 4F
Strip可清除掉tag,剩下 Home Test
04/03 02:12, 4F
文章代碼(AID): #19rErOAu (Perl)
討論串 (同標題文章)
文章代碼(AID): #19rErOAu (Perl)