[問題] 擷取中文特定字串

看板R_Language作者 (sunny_girl)時間4年前 (2020/08/05 15:45), 編輯推噓3(3020)
留言23則, 3人參與, 4年前最新討論串1/1
[問題類型] 程式諮詢 [軟體熟悉度] 入門(寫過其他程式,只是對語法不熟悉) [問題敘述]: 我想要把欄位中的**區擷取出來,網路上看到很多正規式的方式,但因為資料格式不太一致,無法用選位置的方式,想請假板上的神人應該怎麼寫,先感謝了! [程式範例]: https://i.imgur.com/6AwcUJ8.jpg
[環境敘述]: R 3.6.0 [關鍵字]: 字串擷取 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.140.60.223 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1596613525.A.765.html

08/05 16:49, 4年前 , 1F
我建議直接列舉所有直轄市的區名去抓,比純靠reg exp的
08/05 16:49, 1F

08/05 16:49, 4年前 , 2F
邏輯還穩當。
08/05 16:49, 2F

08/05 16:59, 4年前 , 3F
推Andrew大!有的區是三個字(ex:那瑪夏區)直接用清單比對比
08/05 16:59, 3F

08/05 16:59, 4年前 , 4F
較不會錯
08/05 16:59, 4F

08/05 17:31, 4年前 , 5F
這筆資料只有台北市的,看過區應該都剛好是三個字
08/05 17:31, 5F

08/05 18:07, 4年前 , 6F
補上code,包括之後檢查的方向。
08/05 18:07, 6F

08/05 18:07, 4年前 , 7F

08/05 21:49, 4年前 , 8F
感謝A大!!!成功了
08/05 21:49, 8F

08/06 09:54, 4年前 , 9F
遇到character(0)要怎麼刪除,我用data[length(dat
08/06 09:54, 9F

08/06 09:54, 4年前 , 10F
a$region)>0]發現刪不掉
08/06 09:54, 10F

08/06 14:33, 4年前 , 11F
`data`是list嗎?用雙重中括號
08/06 14:33, 11F

08/06 14:37, 4年前 , 12F
更正,試試在我的code後res[sapply(res, length) != 0]
08/06 14:37, 12F

08/06 14:49, 4年前 , 13F
data是資料框
08/06 14:49, 13F

08/06 14:57, 4年前 , 14F
character(0)還是無法刪除
08/06 14:57, 14F

08/06 15:04, 4年前 , 15F
請以code重現你的操作。
08/06 15:04, 15F

08/06 15:16, 4年前 , 16F
data$region[sapply(data$region,length)!=0]
08/06 15:16, 16F

08/06 15:28, 4年前 , 17F
沒有完整重現困難的code與假資料實在無能為力
08/06 15:28, 17F

08/06 15:36, 4年前 , 18F

08/06 15:37, 4年前 , 19F

08/06 15:58, 4年前 , 20F
試試用x<-character(0); identical(x, character(0))去
08/06 15:58, 20F

08/06 15:58, 4年前 , 21F
一個一個檢驗。x應對應一個cell而非一整個column。
08/06 15:58, 21F

08/06 17:31, 4年前 , 22F
找到方法了,在前面資料處理的時候拿掉不要的字串
08/06 17:31, 22F

08/06 17:31, 4年前 , 23F
,之後就不會出現了,感謝你!
08/06 17:31, 23F
文章代碼(AID): #1VAcELTb (R_Language)
文章代碼(AID): #1VAcELTb (R_Language)