PTT數位生活區 / R_Language

[問題] 網頁爬蟲xpath設定問題

看板R_Language作者hslmax (越前)時間9年前 (2017/04/08 03:02)推噓1(1推 0噓 4→)

留言5則, 1人參與討論串1/2 (看更多)

程式諮詢:我想用Ｒ來網頁爬蟲，將購物網站的商品和價格給下載下來。但是，以下這個網站的結構對新手的我來說怎麼try都失敗，想請教各位～謝謝！ [軟體熟悉度]: 入門(寫過其他程式，只是對語法不熟悉) [問題敘述]: 指定xpath收集商品的名稱及價格，但是筆者的能力無法正確指定xpath的路徑 [程式範例]: #Target webpage base_url <- "https://www.zalora.com.tw" url <- "https://www.zalora.com.tw/women/shoes/?category_id=4&Page=" ix <- seq(1,5,1) df.product.info <- data.frame() for (i in ix) { t_url <- paste0(url, i) doc <- read_html(t_url, encoding = "UTF-8") xpath <- '//div[@class="b-catalogList__itm js-catalogList__itm hasOverlay unit size1of3"]' product.brand <- xml_text(xml_find_all(doc, xpath)) ......} 測試結果：0 obs of 1 variable. [環境敘述]: 請提供 sessionInfo() 的輸出結果， macOS 10.12.4、R3.3.2 [關鍵字]:xpath -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.26.45.116 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1491591771.A.C81.html

推

04/08 10:06, , 1^F

04/08 10:06, 1^F

→

04/08 10:07, , 2^F

04/08 10:07, 2^F

→

04/08 10:08, , 3^F

04/08 10:08, 3^F

→

04/08 10:11, , 4^F

04/08 10:11, 4^F

→

04/08 10:12, , 5^F

04/08 10:12, 5^F

‣ 返回看板[ R_Language ] 程式

‣ 更多 hslmax 的文章

文章代碼(AID): #1Ov-9Ro1 (R_Language)

討論串 (同標題文章)

以下文章回應了本文：

Re: [問題] 網頁爬蟲xpath設定問題

9年前, 04/08

完整討論串 (本文為第 1 之 2 篇)：

排序：最新先 | 最舊先 | 留言數

Re: [問題] 網頁爬蟲xpath設定問題

9年前, 04/08

1

5

[問題] 網頁爬蟲xpath設定問題

9年前, 04/08

在新視窗開啟完整討論串 (共2篇)

R_Language 近期熱門文章

2

2

Re: [問題] geombar分類對齊函數

1年前, 04/24

2

2

[問題] geombar分類對齊函數

1年前, 04/21

1

2

徵求R studio家教

1年前, 01/17

1

7

[問題] 請問如何多次複製1筆資料? (求救)

1年前, 11/10

4

6

[問題] 如何將資料重組 (觀察值轉成變數)？

1年前, 10/28

2

8

[問題] 可否以RODBC去連Oracle??

1年前, 08/21

1

3

[問題] augPred function 出現錯誤訊息?

2年前, 07/27

2

8

[問題] IRT相關問題

2年前, 05/01

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

19

63

[情報] 微軟準備用TPM來防賭非法KMS大量授權

[ PC_Shopping ]

1小時前, 07/30

6

8

[討論] 三星s26u 前鏡頭水霧最新案例

1小時前, 07/30

5

35

[請益] 850瓦 PSU 推薦

[ PC_Shopping ]

1小時前, 07/30

4

10

Re: [情報] 三星Z Fold8公布售價預購活動

5小時前, 07/30

5

17

[開箱] 94頂奢技嘉X870E AORUS XTREME X3D

[ PC_Shopping ]

11小時前, 07/29

14

54

[心得] 老生長談之oled pwm調光

11小時前, 07/29

8

21

Re: [閒聊] 2025買到32G迷你電腦是不是很幸運

[ PC_Shopping ]

12小時前, 07/29

24

58

[請益] 蝦皮的白牌記憶體

[ PC_Shopping ]

13小時前, 07/29

更多即時熱門文章 >>

‣ 返回看板[ R_Language ] 程式

‣ 更多 hslmax 的文章

文章代碼(AID): #1Ov-9Ro1 (R_Language)