Re: [問題] readHTMLTable中文亂碼問題
: 以下是本機的資訊:
: sessionInfo()
: R version 2.15.3 (2013-03-01)
: Platform: x86_64-w64-mingw32/x64 (64-bit)
: locale:
: [1] LC_COLLATE=Chinese (Traditional)_Taiwan.950
: [2] LC_CTYPE=Chinese (Traditional)_Taiwan.950
: [3] LC_MONETARY=Chinese (Traditional)_Taiwan.950
: [4] LC_NUMERIC=C
: [5] LC_TIME=Chinese (Traditional)_Taiwan.950
: attached base packages:
: [1] stats graphics grDevices utils datasets methods base
: other attached packages:
: [1] stringr_0.6.2 XML_3.96-1.1
: loaded via a namespace (and not attached):
: [1] tools_2.15.3
: 謝謝
感謝Wush大的意見,但我使用iconv出現下列的錯誤
錯誤在as.vector(x, "character") :
cannot coerce type 'externalptr' to vector of type 'character'
而我的程式碼如下:
############################################
rm(list=ls(all.names=TRUE))
library(XML)
MOPS_URL.TWSE_ALL = "http://mopsov.tse.com.tw/server-java/t05st49_1?kinds=sii&colorchg=1&type=all&step=0a"
test_doc = htmlParse(MOPS_URL.TWSE_ALL,encoding="big5")
#iconv(test_doc)
test = readHTMLTable(test_doc)
test = readHTMLTable(test_doc,which=1,stringsAsFactors=FALSE)
View(test)
###############################################
執行到test = readHTMLTable(test_doc)就會出現
錯誤在nchar(els[[1]]) : 多位元組字串 1 不正確
的錯誤
煩請各位高手能在給我些意見, 謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 210.59.165.121
討論串 (同標題文章)
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章