PTT數位生活區 / R_Language

[問題] html網路爬蟲，網頁無法跑出資料

看板R_Language作者lovedmagic (EricZou)時間9年前 (2016/12/03 16:39)推噓2(2推 0噓 9→)

留言11則, 2人參與討論串1/1

[問題類型]: 程式諮詢(我想用R 做某件事情，但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 新手(沒寫過程式，R 是我的第一次) [問題敘述]: 我想將某個網頁的資料讀取後分析資料，但是一開始就卡關 [程式範例]: library(XML) library(RCurl) ur1=getURL("https://www.kickstarter.com/discover/advanced?woe_id=23424900&sort=magic&seed=2467921&page=2") ur1.1 = readHTMLTable(ur1) test_doc = htmlParse(ur1,encoding="big5") test = readHTMLTable(test_doc) View(test) 我一開始是直接使用ur1="網址"，後來在板上發現有另外一個方法就是getURL("網址") ，之後用readHTMLTable(ur1)去做，但是我不瞭解htmlParse不知道有什麼作用，我在板上也看到許多econding寫成"big5"和"UT-8"(←這是印象)，好像會發生編碼還是轉碼上的問題導致之後R的操作中文部分都會變成亂碼，最後用View(test)去跑發生了 Error in View(test) : invalid 'x' argument 的問題我想請問各位大大，關於kickstart我想取用裡面每一個project就是每一個分頁理面的backers和pledge of MX$ goal還有days to go三項數字，但是我光是讀取頁面就已經發生問題了，請問我在readHTMLTable這方面究竟出現什麼樣的問題呢？ [環境敘述]: Windows 7 R 3.2.2 [關鍵字]: 網路爬蟲、html -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.47.34.42 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1480754351.A.5E3.html

→

12/03 16:59, , 1^F

12/03 16:59, 1^F

→

12/03 17:03, , 2^F

12/03 17:03, 2^F

→

12/03 17:04, , 3^F

12/03 17:04, 3^F

→

12/03 17:04, , 4^F

12/03 17:04, 4^F

推

12/03 17:22, , 5^F

12/03 17:22, 5^F

→

12/03 17:26, , 6^F

12/03 17:26, 6^F

→

12/03 17:59, , 7^F

12/03 17:59, 7^F

推

12/03 17:59, , 8^F

12/03 17:59, 8^F

→

12/03 19:23, , 9^F

12/03 19:23, 9^F

→

12/04 18:42, , 10^F

12/04 18:42, 10^F

→

12/04 18:42, , 11^F

12/04 18:42, 11^F

‣ 返回看板[ R_Language ] 程式

‣ 更多 lovedmagic 的文章

文章代碼(AID): #1OGeIlNZ (R_Language)

R_Language 近期熱門文章

2

2

Re: [問題] geombar分類對齊函數

1年前, 04/24

2

2

[問題] geombar分類對齊函數

1年前, 04/21

1

2

徵求R studio家教

1年前, 01/17

1

7

[問題] 請問如何多次複製1筆資料? (求救)

1年前, 11/10

4

6

[問題] 如何將資料重組 (觀察值轉成變數)？

1年前, 10/28

2

8

[問題] 可否以RODBC去連Oracle??

1年前, 08/21

1

3

[問題] augPred function 出現錯誤訊息?

2年前, 07/27

2

8

[問題] IRT相關問題

2年前, 05/01

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

13

33

[閒聊] MOMO的索泰RTX5070有點髒

[ PC_Shopping ]

3小時前, 07/30

9

22

[閒聊] Sony 擬全資收購 Tamron

11小時前, 07/30

8

13

Re: [心得] TCL維修心得

12小時前, 07/30

69

204

[情報] 微軟準備用TPM來防賭非法KMS大量授權

[ PC_Shopping ]

12小時前, 07/30

32

63

[討論] 三星s26u 前鏡頭水霧最新案例

12小時前, 07/30

9

16

[閒聊] Tamron 25-200 韌體更新提升放大倍率

12小時前, 07/30

18

87

[請益] 850瓦 PSU 推薦

[ PC_Shopping ]

12小時前, 07/30

11

23

Re: [閒聊] 2025買到32G迷你電腦是不是很幸運

[ PC_Shopping ]

13小時前, 07/30

更多即時熱門文章 >>

‣ 返回看板[ R_Language ] 程式

‣ 更多 lovedmagic 的文章

文章代碼(AID): #1OGeIlNZ (R_Language)