Re: [問題] 我想要比對不在 HTML Tag 之中的文字

看板Perl作者 (檸檬汁)時間19年前 (2006/06/19 17:58), 編輯推噓1(101)
留言2則, 2人參與, 最新討論串5/6 (看更多)
※ 引述《Daira (Daira)》之銘言: : 我想在一篇 HTML 的原始碼中搜尋並取代資料 : 比方說我可能要找 'HTML' 這個 pattern,然後取代成 '超文字標記語言' 之類的 : 但是我希望找到的是在畫面上會顯示的 HTML 四個字元 : 而不要它比對到 <html> 或是 </html> 這些 tag 中的 html : 但是我一直想不出 Regular Expression 要怎麼寫 : 所以上來請教大家 >"< : 另外,還有一個問題是,如果我想找的是 'm' 這個 pattern : 可是在 Big5 編碼下,他會比對到 '然' 這個中文字(因為下位元碼是 'M') : 我目前的想法是寫成 : /((?:[\x01-\x7F]|^)(?:[\x80-\xFF]{2})*|^)m/ : 這樣去比對 : 大致上還堪用,可是有一個問題是 : 如果出現連續的兩個 'm',第二個 'm' 會沒有辦法被比對到 : 也是想請教大家有沒有解決辦法... : 感謝大家... /(>[^<]*)HTML/$1超.../g 前提是<和>本身不會出現在tag外/裡面...應該不會有吧?我不熟html =_= -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 143.89.144.107 ※ 編輯: Andor 來自: 143.89.144.107 (06/19 18:04)

06/19 18:20, , 1F
使用此測資就不行 <HTML>HTMLHTML 應該說誤解題意了
06/19 18:20, 1F

06/19 20:29, , 2F
喔...那用 1 while(s/.../.../g); 好嚕
06/19 20:29, 2F
文章代碼(AID): #14bdKsU6 (Perl)
文章代碼(AID): #14bdKsU6 (Perl)