Re: [問題] 抓找出特定字串後的ip

看板RegExp (正規表示式 Regular Expression)作者 (Mr. Pan)時間4年前 (2019/08/31 10:13), 4年前編輯推噓7(706)
留言13則, 6人參與, 4年前最新討論串2/2 (看更多)
※ 引述《NeedSomeone (not NeedAnyone)》之銘言: : 原始的檔案大概如下 : Source IP01: 1.1.1.1 : Source IP02: 2.2.2.2 Source IP03: 3.3.3.3 : 這個檔案有點不太整齊 但是都是Source IPxx: 不定數空格 ip : 今天想抓出某個ip(如ip01後的ip 1.1.1.1) 假設: 1. IP## 的 ## 不會重複 2. 原始檔案有可能會換行 3. Source IP## 後面一定會有空白,只是不確定數量 IPv4 的 Regular expression : (?:(?:25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9][0-9]|[0-9])\.){3}(?:25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9][0-9]|[0-9]) 1. 我這邊直接拿你的 expression 來用沒特別確認 (因為這篇重點不在 IPv4 本身) 2. 我把所有用來 group 的括號加上 ?: 做 non capture grouping 如果之後還有其他用途的話比較方便計算 group 定義: IP## 表示你要找的目標,請自行替換,例如 : IP03 [:IPv4:] 底下代表上面的那個 IPv4 expression,因為太長了, 所以我底下用[:IPv4:] 表示。記得替換成上面的那段。 Expression : (?<=Source IP##:)\s+([:IPv4:]) 解釋: 利用 positive lookbehind , 限定要找特定 pattern 後的目標 但由於 lookbehind 內不能使用不定長度,所以 \s+ 放在外面, 另外透過 capture 抓出 IP 利用 find 或 match 之類的方法取出 group 1 即可拿到 IP NOTE :group 0 是整個 match 的部分,會包含空格 如果 IP##: 後面不一定有空白,就把 + 改成 * 假設要找 的是 IP03 的,完整 expression (?<=Source IP03:)\s+((?:(?:25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9][0-9]|[0-9])\.){3} (?:25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9][0-9]|[0-9])) 我把範例放在 regex101 上 : https://regex101.com/r/sG1qP1/498 注意: 不是所有工具、語言都支援 lookbehind , 例如 JavaScript 要 ES2018 才開始支援 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.166.56.154 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/RegExp/M.1567217592.A.8A6.html ※ 編輯: darkk6 (118.166.56.154 臺灣), 08/31/2019 10:16:48

08/31 14:20, 4年前 , 1F
推(Y),詳細!
08/31 14:20, 1F

08/31 21:20, 4年前 , 2F
講解的好仔細,用心 推
08/31 21:20, 2F

09/01 02:52, 4年前 , 3F
真的很感謝 不過google apps script不支援lookbehind
09/01 02:52, 3F

09/01 02:53, 4年前 , 4F
但是您的啟發 讓我可以用lookahead反向過來處理
09/01 02:53, 4F

09/01 02:54, 4年前 , 5F
再一次感謝 謝謝
09/01 02:54, 5F

09/03 16:07, 4年前 , 6F
不用look behind 吧,直接在patten 寫前面那堆,然後I
09/03 16:07, 6F

09/03 16:07, 4年前 , 7F
P 部份用capture group 取就好
09/03 16:07, 7F

09/12 09:57, 4年前 , 8F
(?<=Source IP..:)\s+\d\.\d\.\d\.\d ,這樣是不是比較短
09/12 09:57, 8F

09/14 03:41, 4年前 , 9F
To 樓上: 你這樣只會匹配一個數字喔,例: 1.2.3.4
09/14 03:41, 9F

09/16 10:39, 4年前 , 10F
那只是範例阿,改一下就好
09/16 10:39, 10F

09/16 10:42, 4年前 , 11F
(?<=Source IP01:)\s+\d{1,}\.\d{1,}\.\d{1,}\.\d{1,}
09/16 10:42, 11F

09/22 18:01, 4年前 , 12F
(Source IP\d\d\:)\s+(那串IP的regex)
09/22 18:01, 12F

09/29 03:51, 4年前 , 13F
To 樓樓上: IP 的數字是 0~255而已喔!
09/29 03:51, 13F
文章代碼(AID): #1TQTUuYc (RegExp)
討論串 (同標題文章)
文章代碼(AID): #1TQTUuYc (RegExp)