[問題] 用多筆資料拼湊出完整資料表
我的資料長相如下:
> head(list18c)
# A tibble: 6 x 8
姓名 單位 職稱 地址 電話 傳真號碼 手機 email
<chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
1 廖AA 中正大學 教授 621嘉義縣 <NA> <NA> 0918-333~ <NA>
2 田BB <NA> <NA> 100台北市 <NA> <NA> 0911-246~ <NA>
3 陳CC <NA> <NA> 407台中市 <NA> <NA> 0988-111~ <NA>
4 黃DD <NA> <NA> <NA> <NA> <NA> <NA> <NA>
5 陳EE 台灣大學 教授 <NA> <NA> <NA> <NA> <NA>
6 唐FF <NA> <NA> 242新北市 <NA> <NA> 0928-555~ <NA>
【目的】:拼湊出一個完整的資料表。
【說明】:
一、我有好幾份資料,有相同的欄位,但是各自不齊全,唯一可比對的根據是「姓名」。
例如「田BB」在A資料表中有地址及手機,在B資料表中有單位和職稱,
C資料表有email,D資料表有電話及傳真號碼。
可以如何下指令,讓R可以自動拼湊出完整的表?
(簡單的想法,是請R將不是NA的資料列給我,我再case by case於新表格上湊滿)
(但是又有另一個問題,若有兩個以上的資料表同時都有寫同一欄位卻不相同?)
二、若是有欄位誤填(「單位」寫教授、「職稱」寫「XX公司」),除了copy & paste,
有什麼較聰明的方法?
三、有關地址前面的郵遞區號,若想要獨立分割成新的欄位,但是有些是3碼有些是5碼,
有什麼方式可以指示「請從第一個數字切割到第一個中文字之前」?
以上,感謝解答~
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.194.164.43
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1556273052.A.E25.html
推
04/26 20:29,
6年前
, 1F
04/26 20:29, 1F
→
04/27 00:49,
6年前
, 2F
04/27 00:49, 2F
→
04/27 00:50,
6年前
, 3F
04/27 00:50, 3F
→
04/27 00:51,
6年前
, 4F
04/27 00:51, 4F
→
04/27 11:26,
6年前
, 5F
04/27 11:26, 5F
推
04/30 15:05,
6年前
, 6F
04/30 15:05, 6F
→
04/30 15:05,
6年前
, 7F
04/30 15:05, 7F
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章