[問題] xpathSApply 問題

看板R_Language作者 (成登)時間10年前 (2014/11/09 20:35), 編輯推噓1(102)
留言3則, 3人參與, 最新討論串1/1
[軟體熟悉度]: 小弟大概使用R一個月,之前有些寫過其他程式 [問題敘述]: 想利用R來抓網頁進行一些圖表分析 想利用xpathSApply來抓網頁內容,但讀不到網頁內容 [程式範例]: getdoc <- function(line){ start <- regexpr('www', line)[1] end <- regexpr('html', line)[1] if(start != -1 & end != -1){ url <- substr(line, start, end+3) html <- htmlParse(getURL(url), encoding='UTF-8', useInternalNodes = T) doc <- xpathSApply(html, "//div[@id='main-content']", xmlValue) name <- strsplit(url, '/')[[1]][4] write(doc, gsub('html', 'txt', name)) } } sapply(data, getdoc) 有上網survey過也try過許多方法一直try不出來,因此想請問各位神人問題出在哪? doc一直讀不出東西來 [關鍵字]: xpathSApply -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.118.201.208 ※ 文章網址: http://www.ptt.cc/bbs/R_Language/M.1415536549.A.7C0.html

11/09 20:42, , 1F
有reproducible example嗎? 會讓想幫忙的版友比較容易測
11/09 20:42, 1F

11/09 22:31, , 2F
RCURL XML
11/09 22:31, 2F

11/20 02:13, , 3F
試試 我剛剛試了可以抓到
11/20 02:13, 3F
文章代碼(AID): #1KNr-bV0 (R_Language)
文章代碼(AID): #1KNr-bV0 (R_Language)