PTT數位生活區 / R_Language

[問題] scraping HTML tables

看板R_Language作者luenchang (luen)時間5年前 (2021/02/22 16:53)推噓1(1推 0噓 4→)

留言5則, 3人參與討論串1/1

請教一個和爬蟲相關的問題。我想爬的是這個網頁 https://quickfs.net/company/A2M:AU 裡的兩個tables, (1) Key Statistics及 (2) 拉下式選單下面的表。我是用copy xpath 的方式，我試了幾乎所有element的xpath, 但是沒有一個能夠讀到數據。不知道是我爬的網頁有防爬的設計，還是我的xpath找錯了? 以下是我的R code # URLs url.main <- "https://quickfs.net/company" url.ASX.A2M <- file.path(url.main,"A2M:AU") # Copy xpath of tables xpath.1 <- '//*[@id="ovr-table"]' xpath.2 <- '//*[@id="ovr-table"]/tbody' xpath.3 <- '//*[@id="ovr-table"]/tbody/tr[1]' # Get html table into a data.frame A2M <- url.ASX.A2M %>% xml2::read_html() %>% html_nodes(xpath=xpath.1) %>% html_table() A2M # list() -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 110.174.219.126 (澳大利亞) ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1613984007.A.4C6.html

推

02/22 17:05, 5年前 , 1^F

02/22 17:05, 1^F

→

02/22 17:26, 5年前 , 2^F

02/22 17:26, 2^F

→

02/22 17:27, 5年前 , 3^F

02/22 17:27, 3^F

→

02/22 18:31, 5年前 , 4^F

02/22 18:31, 4^F

→

02/22 18:31, 5年前 , 5^F

02/22 18:31, 5^F

‣ 返回看板[ R_Language ] 程式

‣ 更多 luenchang 的文章

文章代碼(AID): #1WCt47J6 (R_Language)

R_Language 近期熱門文章

2

2

Re: [問題] geombar分類對齊函數

1年前, 04/24

2

2

[問題] geombar分類對齊函數

1年前, 04/21

1

2

徵求R studio家教

1年前, 01/17

1

7

[問題] 請問如何多次複製1筆資料? (求救)

1年前, 11/10

4

6

[問題] 如何將資料重組 (觀察值轉成變數)？

1年前, 10/28

2

8

[問題] 可否以RODBC去連Oracle??

1年前, 08/21

1

3

[問題] augPred function 出現錯誤訊息?

2年前, 07/27

2

8

[問題] IRT相關問題

2年前, 05/01

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

11

31

[情報] 等等黨大澇賽… 越等越貴

[ PC_Shopping ]

15分鐘前, 07/28

17

35

Re: [新聞] 華碩宣布重返平板市場！全新ASUS Pad亮

1小時前, 07/28

78

161

Re: [閒聊] 傳聞下周N卡漲20% 8月其他零件跟上

[ PC_Shopping ]

2小時前, 07/28

3

11

[新聞] 蘋果釋出 iOS 26.6 更新版本！狂修近 90

2小時前, 07/28

5

5

[賣/台南/皆可] EVGA 3080 XC3 + 850W GA 電供 (

[ HardwareSale ]

3小時前, 07/28

6

11

[方案] 遠傳 vs 台哥大 4G 吃到飽

5小時前, 07/28

19

30

[賣/雙北/面交] EVGA RTX 3070 Ti FTW3 Ultra

[ HardwareSale ]

6小時前, 07/28

29

44

[情報] iOS 26.6置底

14小時前, 07/28

更多即時熱門文章 >>

‣ 返回看板[ R_Language ] 程式

‣ 更多 luenchang 的文章

文章代碼(AID): #1WCt47J6 (R_Language)