[問題] 不乾淨的資料匯入、如何處理?

看板R_Language作者 (社會黑暗、行路難)時間7年前 (2018/03/05 17:56), 編輯推噓1(105)
留言6則, 4人參與, 7年前最新討論串1/1
※ [本文轉錄自 Statistics 看板 #1QdHGr4X ] 作者: paranoia5201 (社會黑暗、行路難) 看板: Statistics 標題: [問題] 不乾淨的資料匯入、如何處理? 時間: Mon Mar 5 17:56:03 2018 各位好: 這裡想要請教、如果拿到的原始檔不是很漂亮、該要怎麼匯入處理? 我直接面對的例子是死因統計年報(下載:dep.mohw.gov.tw/DOS/lp-3352-113.html) 打開檔案後會發現它每個分頁的頭幾列都是各式主標題與子標題。 我該如何處理這部分、好讓它可以在匯入之後做運算整理呢? 感謝~ (預計使用的軟體為R、Python、還有SAS) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.117.132 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1520243765.A.121.html ※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: paranoia5201 (140.112.117.132), 03/05/2018 17:56:35

03/05 18:44, 7年前 , 1F
readxl::read_excel會幫你讀成table格式
03/05 18:44, 1F

03/05 18:52, 7年前 , 2F
處理試算表的package大多可以按分頁讀入
03/05 18:52, 2F

03/05 18:54, 7年前 , 3F
讀入後就是各別對付了,没什麼法門。
03/05 18:54, 3F

03/06 23:25, 7年前 , 4F
衛福部有全死因檔從那個資料再整理出來比較快(吧)
03/06 23:25, 4F

03/07 12:25, 7年前 , 5F
想問R有套件能處理主副標嗎?還是只能手動處理excel再匯入
03/07 12:25, 5F

03/07 19:22, 7年前 , 6F
讀入的function常有前幾列不讀的參數,可幫點忙
03/07 19:22, 6F
文章代碼(AID): #1QdHHLFs (R_Language)
文章代碼(AID): #1QdHHLFs (R_Language)