[心得] 中文編碼處理
[關鍵字]: R, Encoding
[重點摘要]:
上個月我在台大授課時撰寫了一份swirl 教材:
https://github.com/wush978/DataScienceAndR
其中 RBasic-07-Loading-Dataset 寫了目前我知道的數個R 處理Encoding的方法。
由於坊間比較少解決載入中文資料的R 教材,
而且我今天晚上才剛更新這門課程的內容,需要有網友幫忙測測看相容性。
所以希望有任何想了解如何解決中文資料編碼問題的網友,可以一邊學,一邊幫我測。
以下列出教材中有提到的部分:
1. file + 參數 encoding
- 在windows上遇到如UTF-16仍然會出錯
2. readBin + stringi::stri_encode + textConnection + 參數 encoding
- 目前可以解決我手上所有中文的狀況,但是效能稍差
有興趣幫忙測試的網友,
請依照README的只是安裝課程之後,直接進入RBasic-07-Loading-Dataset進行課程。
有任何問題或feedback(安裝看不懂、解釋看不懂、電腦爆炸...)
歡迎截圖貼到 https://github.com/wush978/DataScienceAndR/issues 開issue給我
先謝謝各位
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.161.31.173
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1447435261.A.79B.html
※ 編輯: Wush978 (140.109.127.9), 11/14/2015 11:43:42
推
11/14 18:20, , 1F
11/14 18:20, 1F
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章