[問題] 文字內容取資料 regex
滿常要去打網頁取資料
通常讀回來的內容長的會是下面這樣
A=xxx,B=ooo,C=yyy,…
A="aaa" B="bbb"……
中間分隔的可能是逗號分號或空白
等號右邊的值可能有放引號或沒引號
我太菜只會用Split去做分割
想請問有比較好的處理方式嗎?
A=xxx,B=ooo…算一筆資料
一次處理的量大概都幾千筆
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.45.234
※ 文章網址: https://www.ptt.cc/bbs/C_Sharp/M.1481504102.A.12A.html
推
12/12 09:18, , 1F
12/12 09:18, 1F
推
12/12 12:43, , 2F
12/12 12:43, 2F
推
12/12 12:59, , 3F
12/12 12:59, 3F
感謝IKAFIRE前輩的提示
用Split是可以用
但是就覺得有點土法煉鋼的感覺
原始資料先拆成一次>>>取單筆
單筆再拆一次取每個等號的資料
用兩次foreach來達成
這樣做比起regex的效能是否比較差?
這邊是我自己try出來的規則
string rule = @"A=(?<1>[^,]), ";
這樣可以取到match.Group["1"]的值(A的值)
※ 編輯: skitty (114.136.45.234), 12/12/2016 14:14:21
※ 編輯: skitty (114.136.45.234), 12/12/2016 14:14:53
→
12/12 14:44, , 4F
12/12 14:44, 4F
推
12/12 17:12, , 5F
12/12 17:12, 5F
→
12/12 17:14, , 6F
12/12 17:14, 6F
推
12/12 17:17, , 7F
12/12 17:17, 7F
→
12/12 17:18, , 8F
12/12 17:18, 8F
→
12/12 17:19, , 9F
12/12 17:19, 9F
感謝 !!
※ 編輯: skitty (223.137.178.2), 12/12/2016 22:29:37
C_Sharp 近期熱門文章
PTT數位生活區 即時熱門文章