[問題] 如何整理數量位置資料如:1胃,2腸
[軟體熟悉度]:新手+入門
[問題敘述]:
手上有一筆某蛙類的解剖資料,想要分析食性。
紀錄的時候會長這樣:
ID,Food A,Food B,Food C,Food E
C146,,,,3腸
B287,,,,10腸
C140,,,,4腸
C133,,,1腸,
C132,1腸,,,
B305,,,1腸,
C112,,2腸,,1腸
C120,,,,1腸
C128,,,,1腸
想要整理成這樣的資料:
ID, Food type, Amount, Location
C146, E, 3, 腸
B287, E, 10, 腸
C140, E, 4, 腸
C133, C, 1, 腸
目前我知道怎麼用tidyr::gather()整理資料,
但目前想不到要怎麼把混在一起的數字和文字分開。
因為數量不一定都是一位數的數字,位置也會有兩個字的狀況,
純粹把資料當成文字硬去抽取特定位置沒辦法解決這個問題。
資料量不大,其實可以用Excel做,
但我在Excel就是用left()和right()抽取最常見的位數,
再用工人智慧去檢核。理論上在R應該有更人工智慧(?)的方法?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.130.96.14
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1436508883.A.117.html
※ 編輯: helixc (140.130.96.14), 07/10/2015 14:17:19
※ 編輯: helixc (140.130.96.14), 07/10/2015 14:22:30
※ 編輯: helixc (140.130.96.14), 07/10/2015 14:24:46
→
07/10 15:02, , 1F
07/10 15:02, 1F
→
07/10 15:04, , 2F
07/10 15:04, 2F
→
07/10 15:04, , 3F
07/10 15:04, 3F
→
07/10 15:21, , 4F
07/10 15:21, 4F
→
07/10 15:22, , 5F
07/10 15:22, 5F
→
07/10 15:59, , 6F
07/10 15:59, 6F
→
07/10 16:00, , 7F
07/10 16:00, 7F
→
07/10 16:01, , 8F
07/10 16:01, 8F
→
07/10 16:29, , 9F
07/10 16:29, 9F
→
07/10 16:29, , 10F
07/10 16:29, 10F
推
07/10 17:47, , 11F
07/10 17:47, 11F
→
07/10 20:06, , 12F
07/10 20:06, 12F
→
07/10 20:12, , 13F
07/10 20:12, 13F
討論串 (同標題文章)
以下文章回應了本文 (最舊先):
完整討論串 (本文為第 1 之 3 篇):
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章