PTT數位生活區 / R_Language

[問題] 爬蟲抓取資料問題

看板R_Language作者ya32347844 (虛虛樂)時間8年前 (2017/03/17 00:02)推噓0(0推 0噓 9→)

留言9則, 2人參與討論串1/2 (看更多)

[問題類型]:網路爬蟲 [軟體熟悉度]:入門 [問題敘述]: 我想要抓這個網頁的資料但不知道是不是Ｘpath寫錯了我到後來抓到的資料是ＮＵＬＬ懇請各位大神給予指教如果有需要補充的資訊也請不吝指出已經google過相關訊息用不同的package但結果相同所以才會覺得是不是一層一層的Tag 寫錯了 Update Code: myheader <- c( "User-Agent"="Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_0_1 like Mac OS X; ja-jp) AppleWebKit/532.9 (KHTML, like Gecko) Version/4.0.5 Mobile/8A306 Safari/6531.22.7", "Accept"="text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8", "Accept-Language"="en-us", "Connection"="keep-alive", "Accept-Charset"="GB2312,utf-8;q=0.7,*;q=0.7" ) #加上myheader d <- debugGatherer() get_url <- getURL(url, httpheader = myheader, debugfunction = d$update, verbose = T) get_url_parse = htmlTreeParse(get_url, encoding = "UTF-8", error=function(...){}, useInternalNodes = TRUE,trim=TRUE) cat(d$value()[3]) node<-getNodeSet(get_url_parse, "//div[@class='page-content-wrapper']") info<-sapply(node,xmlValue) info [程式範例]: library(XML) library(RCurl) url="https://www.eex.com/en/market-data/environmental-markets/spot-market/european-emission-allowances#!/2017/01/04" get_url = getURL(url,encoding = "UTF-8") #將url解析 get_url_parse = htmlParse(get_url, encoding = "UTF-8") tablehead <- xpathSApply(get_url_parse, "//div[@id='content']/section[@class='clearfix']/article[@id='market_data']/div[@id='content']/div/div/div/div",xmlValue) [環境敘述]: mac10.12.2 [關鍵字]: -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.131.182 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1489680159.A.038.html

→

03/17 00:25, , 1^F

03/17 00:25, 1^F

→

03/17 00:25, , 2^F

03/17 00:25, 2^F

→

03/17 00:25, , 3^F

03/17 00:25, 3^F

→

03/18 17:50, , 4^F

03/18 17:50, 4^F

→

03/18 17:51, , 5^F

03/18 17:51, 5^F

→

03/18 17:51, , 6^F

03/18 17:51, 6^F

→

03/18 17:51, , 7^F

03/18 17:51, 7^F

→

03/18 22:05, , 8^F

03/18 22:05, 8^F

※ 編輯: ya32347844 (114.36.131.182), 03/18/2017 23:44:44

→

03/18 23:46, , 9^F

03/18 23:46, 9^F

‣ 返回看板[ R_Language ] 程式

‣ 更多 ya32347844 的文章

文章代碼(AID): #1OohSV0u (R_Language)

討論串 (同標題文章)

以下文章回應了本文：

1

2

Re: [問題] 爬蟲抓取資料問題

8年前, 03/19

完整討論串 (本文為第 1 之 2 篇)：

排序：最新先 | 最舊先 | 留言數

1

2

Re: [問題] 爬蟲抓取資料問題

8年前, 03/19

0

9

[問題] 爬蟲抓取資料問題

8年前, 03/17

在新視窗開啟完整討論串 (共2篇)

R_Language 近期熱門文章

2

2

Re: [問題] geombar分類對齊函數

6月前, 04/24

2

2

[問題] geombar分類對齊函數

6月前, 04/21

1

2

徵求R studio家教

9月前, 01/17

1

7

[問題] 請問如何多次複製1筆資料? (求救)

1年前, 11/10

4

6

[問題] 如何將資料重組 (觀察值轉成變數)？

1年前, 10/28

2

8

[問題] 可否以RODBC去連Oracle??

1年前, 08/21

1

3

[問題] augPred function 出現錯誤訊息?

1年前, 07/27

2

8

[問題] IRT相關問題

1年前, 05/01

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

1

29

[討論] 5G還未普及6G就要來了，少子化會造成漲

9小時前, 11/10

17

56

[情報] 京東 9800X3D 13024元 9700X 7063元

[ PC_Shopping ]

12小時前, 11/10

9

19

[問題] 這是被盜還是什麼?

13小時前, 11/10

5

9

[心得] 9070XT RCOm7 純Win環境AI跑圖心得後續-1

[ PC_Shopping ]

15小時前, 11/10

16

98

Re: [新聞] 4G吃到飽時代結束了，電信業者聯合下架？

18小時前, 11/10

14

24

[請益] ［菜單］看動畫的喇叭

[ PC_Shopping ]

18小時前, 11/10

7

22

Re: [閒聊] 老黃的鍋似乎不只12V爛接頭的問題

[ PC_Shopping ]

18小時前, 11/10

9

19

iphone14換pixel 9pro會有升級感嗎？

19小時前, 11/09

更多即時熱門文章 >>

‣ 返回看板[ R_Language ] 程式

‣ 更多 ya32347844 的文章

文章代碼(AID): #1OohSV0u (R_Language)