看板 [ Perl ]
討論串[問題] 我想要比對不在 HTML Tag 之中的文字
共 6 篇文章
首頁
上一頁
1
2
下一頁
尾頁

推噓1(1推 0噓 0→)留言1則,0人參與, 最新作者gugod (gg)時間19年前 (2006/06/29 01:44), 編輯資訊
0
0
0
內容預覽:
試試看這個,我把說明直接寫在裡面。假設你整個 HTML 內容全讀進 $_ 裡了. s{(?<! # negative look-behind. < # 找 <. /? # 可能帶有一個斜線. ). html # 找 html 四個字. (?! # negative look-ahead. .*? #
(還有164個字)

推噓1(1推 0噓 1→)留言2則,0人參與, 最新作者Andor (檸檬汁)時間19年前 (2006/06/19 17:58), 編輯資訊
0
0
0
內容預覽:
/(>[^<]*)HTML/$1超.../g. 前提是<和>本身不會出現在tag外/裡面...應該不會有吧?我不熟html =_=. --. 發信站: 批踢踢實業坊(ptt.cc). ◆ From: 143.89.144.107. 編輯: Andor 來自: 143.89.144.107 (

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者Daira (Daira)時間19年前 (2006/06/11 15:07), 編輯資訊
0
0
0
內容預覽:
這個方法在這個 case 下可以運作 ^^. 可是有時候可能我要取代的字串是 'src' 三個字元. 他會出現在 <img src="xxx.jpg"> 這種地方. 可能就沒有辦法用窮舉法去排除所有例子. 另外,我順便提出我目前的想法. 就是先把 /<.?>/ 這種 pattern 取代成一組編號
(還有63個字)

推噓1(1推 0噓 0→)留言1則,0人參與, 最新作者cutecpu (可愛中央處理器)時間19年前 (2006/06/11 00:39), 編輯資訊
0
0
0
內容預覽:
$pat1='(?<=[^<]/)html';. $pat2='(?<=[^</])html';. $pat3='html(?=[^>])';. $pat4='^html';. /$pat1|$pat2|$pat3|$pat4/i. --. 發信站: 批踢踢實業坊(ptt.cc). ◆ From

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者Daira (Daira)時間19年前 (2006/06/10 13:26), 編輯資訊
0
0
0
內容預覽:
補充一下我的問題. 我目前的想法是,只要 pattern 出現在 < 和 > 符號之中,就可以直接忽略掉. 但是這個想法不知道要怎麼實作. 我之前有找到一個解決辦法是用 use encoding 'big5';. 測試過之後還是會有一些奇怪的問題(比方說取代時還是會切到一個中文字). 而且重點是,執
首頁
上一頁
1
2
下一頁
尾頁