Re: [問題] readHTMLTable中文亂碼問題

看板R_Language作者 (拒看低質媒體)時間11年前 (2013/05/27 16:36), 編輯推噓1(100)
留言1則, 1人參與, 最新討論串3/5 (看更多)
這是我在windows上測出來的方式: ```r rm(list=ls(all.names=TRUE)) library(XML) MOPS_URL.TWSE_ALL = "http://mopsov.tse.com.tw/server-java/t05st49_1?kinds=sii& colorchg=1&type=all&step=0a" temp <- readLines(url(MOPS_URL.TWSE_ALL), encoding="big5") temp <- iconv(temp, "big5", "utf8") temp.file <- tempfile() write(temp, temp.file) test_doc = htmlParse(temp.file, encoding="utf8") test <- readHTMLTable(test_doc) test ``` ※ 引述《youngce (時間會讓人遺忘)》之銘言: : : 以下是本機的資訊: : : sessionInfo() : : R version 2.15.3 (2013-03-01) : : Platform: x86_64-w64-mingw32/x64 (64-bit) : : locale: : : [1] LC_COLLATE=Chinese (Traditional)_Taiwan.950 : : [2] LC_CTYPE=Chinese (Traditional)_Taiwan.950 : : [3] LC_MONETARY=Chinese (Traditional)_Taiwan.950 : : [4] LC_NUMERIC=C : : [5] LC_TIME=Chinese (Traditional)_Taiwan.950 : : attached base packages: : : [1] stats graphics grDevices utils datasets methods base : : other attached packages: : : [1] stringr_0.6.2 XML_3.96-1.1 : : loaded via a namespace (and not attached): : : [1] tools_2.15.3 : : 謝謝 : 感謝Wush大的意見,但我使用iconv出現下列的錯誤 : 錯誤在as.vector(x, "character") : : cannot coerce type 'externalptr' to vector of type 'character' : 而我的程式碼如下: : ############################################ : rm(list=ls(all.names=TRUE)) : library(XML) : MOPS_URL.TWSE_ALL = "http://mopsov.tse.com.tw/server-java/t05st49_1?kinds=sii&colorchg=1&type=all&step=0a" : test_doc = htmlParse(MOPS_URL.TWSE_ALL,encoding="big5") : #iconv(test_doc) : test = readHTMLTable(test_doc) : test = readHTMLTable(test_doc,which=1,stringsAsFactors=FALSE) : View(test) : ############################################### : 執行到test = readHTMLTable(test_doc)就會出現 : 錯誤在nchar(els[[1]]) : 多位元組字串 1 不正確 : 的錯誤 : 煩請各位高手能在給我些意見, 謝謝 -- 歡迎到ptt R_Language版分享R 的相關知識 歡迎加入 Taiwan R User Group : http://www.facebook.com/Tw.R.User 聚會報名 http://www.meetup.com/Taiwan-R/ 聚會影片 https://www.youtube.com/user/TWuseRGroup -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.42.22

05/27 19:06, , 1F
感謝Wush大,問題已解決!!
05/27 19:06, 1F
文章代碼(AID): #1HeniGls (R_Language)
文章代碼(AID): #1HeniGls (R_Language)