[問題] table問題(網頁編碼)
請問我想把亞東健檢中心(http://depart.femh.org.tw/HMC/wholebody.html)的表格爬下
來,但會出現亂碼在windows系統中,使用R語言,抓取表格呈現出亂碼,
我們將格式轉為繁體,
還是會呈現亂碼,我們研究出所有BIG5編碼的網頁,轉換後,還是亂碼,
程式如下:
library(XML)
URL = paste0("http://depart.femh.org.tw/HMC/wholebody.html")
doc<-htmlParse(URL,encoding="UTF-8")
tables<-readHTMLTable(doc,header=T,which = 2)
tables
dim(tables)
View(tables)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.42.187.234
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1465129416.A.876.html
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 4 篇):
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章