討論串[問題] 讀入"鴴" "鸊鷉" 等怪字
共 6 篇文章
內容預覽:
[軟體熟悉度]:. 新手+入門. [問題敘述]:. 如標題,因為再分析鳥類的資料,所以會遇到鴴、鸊、鷉這種某些系統無法顯示的字. 和程式語言不太熟,好像是BIG5的編碼比較少,所以遇到這些怪字會崩潰,. 轉到UTF8就會恢復正常?. 問題是目前手邊的名錄都是放在Excel當中,. 這些怪字在Exce
(還有618個字)
內容預覽:
txt部分:. read.table, read.csv加上encoding = "UTF-8"只能讀到第二行. 但下面這個有成功:. readLines("birdnametest.txt", encoding = "UTF-8") %>%. strsplit(",") %>% do.call(r
(還有1362個字)
內容預覽:
因為xls可以存取UTF-8位元,昨天就有想到可以直接讀取xls。. 但rJava這個package一直裝不進去.... install.packages('rJava') #這部分沒有問題. library(rJava) #這邊就產生下面的錯誤訊息. Error : .onLoad failed
(還有684個字)
內容預覽:
我的環境是 Mac OS X 10.9.5. R 版本是 3.1.1 終端機 locale 是 zh_TW-utf8. Excel 版本是 2011 for OS X. 剛剛簡單測了一下這個 xls 檔. 如過透過 Excel 轉成 CSV 檔,再透過 iconv 轉的話. 有些字會漏失,像是「鵐」
(還有208個字)
內容預覽:
這邊報告一下... readxl這個套件沒問題,. 但用dplyr處裡資料的時候就會有問題。. [code]. library(readxl). library(dplyr). fileName = "birdnames.xls". #讀取資料. x = read_excel(fileName).
(還有464個字)