[問題] 用regex提取2到3位的數字
各位先進,
我想從字串中提取出數字的部分。我的字串有規律性,結構上,開頭是2到3位的數字,空白
,接著不等位數的字母,或字母和數字。我想提取的是開頭的部分。我試了兩個方法,方法
1只拿出數字的最末位,方法2拿出完整的數字。我不知道方法1的regex寫法有什麼錯。
以下是我的字串及code
# Strings to extract
strings <- c("130 UDINE", "162 BF02", "163 AS04", "164 AL08", "165 BR12", "166 S
A13", "167 MA14", "167 MA14", "168 OC15", "85 BERGAMO")
# Method 1 to extract the beginning part of the strings (not working)
gsub(pattern = "^(\\d){2,3}(\\s).*", replacement = "\\1", x=strings)
# [1] "0" "2" "3" "4" "5" "6" "7" "7" "8" "5"
# Method 2 to extract the beginning part of the strings (not working)
gsub(pattern = "^(\\d+)(\\s).*", replacement = "\\1", x=strings)
# [1] "130" "162" "163" "164" "165" "166" "167" "167" "168" "85"
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 110.174.219.126 (澳大利亞)
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1608524232.A.14D.html
推
12/21 13:11,
4年前
, 1F
12/21 13:11, 1F
→
12/21 13:11,
4年前
, 2F
12/21 13:11, 2F
→
12/21 13:23,
4年前
, 3F
12/21 13:23, 3F
→
12/21 13:24,
4年前
, 4F
12/21 13:24, 4F
→
12/21 20:30,
4年前
, 5F
12/21 20:30, 5F
→
12/21 20:30,
4年前
, 6F
12/21 20:30, 6F
推
12/21 21:45,
4年前
, 7F
12/21 21:45, 7F
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章