[心得] 中文編碼處理

看板R_Language作者 (拒看低質媒體)時間10年前 (2015/11/14 01:21), 10年前編輯推噓1(100)
留言1則, 1人參與, 最新討論串1/1
[關鍵字]: R, Encoding [重點摘要]: 上個月我在台大授課時撰寫了一份swirl 教材: https://github.com/wush978/DataScienceAndR 其中 RBasic-07-Loading-Dataset 寫了目前我知道的數個R 處理Encoding的方法。 由於坊間比較少解決載入中文資料的R 教材, 而且我今天晚上才剛更新這門課程的內容,需要有網友幫忙測測看相容性。 所以希望有任何想了解如何解決中文資料編碼問題的網友,可以一邊學,一邊幫我測。 以下列出教材中有提到的部分: 1. file + 參數 encoding - 在windows上遇到如UTF-16仍然會出錯 2. readBin + stringi::stri_encode + textConnection + 參數 encoding - 目前可以解決我手上所有中文的狀況,但是效能稍差 有興趣幫忙測試的網友, 請依照README的只是安裝課程之後,直接進入RBasic-07-Loading-Dataset進行課程。 有任何問題或feedback(安裝看不懂、解釋看不懂、電腦爆炸...) 歡迎截圖貼到 https://github.com/wush978/DataScienceAndR/issues 開issue給我 先謝謝各位 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.161.31.173 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1447435261.A.79B.html ※ 編輯: Wush978 (140.109.127.9), 11/14/2015 11:43:42

11/14 18:20, , 1F
stringi+encoding help in many cases~ Thanks sharing~
11/14 18:20, 1F
文章代碼(AID): #1MHXlzUR (R_Language)
文章代碼(AID): #1MHXlzUR (R_Language)