PTT數位生活區 / R_Language

Re: [問題] htmlParse

看板R_Language作者celestialgod (攸藍)時間11年前 (2015/05/04 12:53)推噓3(3推 0噓 5→)

留言8則, 2人參與討論串2/2 (看更多)

: [問題類型]: : 程式諮詢(我想用R 做某件事情，但是我不知道要怎麼用R 寫出來) : : [問題敘述]: : 1.請問htmlParse返回的結果是否有size限制? : 我用下面一段code htmlParse返回只有到[[288]],似乎沒有抓完? : 如果是size的限制有辦法解決嗎? 這我不知道，但是我用RCurl有抓到全部，直接htmlParse就失敗了： test_doc = getURL(URL,.encoding="big5") test = htmlParse(test_doc, encoding="big5") test["//tr"] %>% str() # List of 11655 test_doc = htmlParse(URL,encoding="big5") test = test_doc["//tr"] %>% str() # List of 288 : 2.我試著用readLines讀同樣的網址,但因沒有換行符號,所有的資料只存成一行, : 處裡這一類沒有換行符號的網址,有什麼好方法呢? readLines之後用gsub把你要斷行的地方放進去 EX: 我要把每一個開始或結束的tag後面都放置一個斷行，這個要用一些regular expression的知識 gsub("(</?[^>]*>)", "\\1\\\n", "<tr><td bgcolor=\"#FAFAD2\" colspan=\"7\"><b> 股票 <b> </b></b></td></tr>") %>% sprintf("%s", .) %>% cat() output: <tr> <td bgcolor="#FAFAD2" colspan="7"> <b> 股票 <b> </b> </b> </td> </tr> -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.205.27.107 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1430715193.A.1AD.html ※ 編輯: celestialgod (123.205.27.107), 05/04/2015 13:10:06

推

05/05 01:42, , 1^F

05/05 01:42, 1^F

→

05/05 01:43, , 2^F

05/05 01:43, 2^F

→

05/05 01:45, , 3^F

05/05 01:45, 3^F

→

05/05 08:18, , 4^F

05/05 08:18, 4^F

→

05/05 08:19, , 5^F

05/05 08:19, 5^F

推

05/05 23:55, , 6^F

05/05 23:55, 6^F

→

05/06 00:02, , 7^F

05/06 00:02, 7^F

推

05/06 12:28, , 8^F

05/06 12:28, 8^F

‣ 返回看板[ R_Language ] 程式

‣ 更多 celestialgod 的文章

文章代碼(AID): #1LHliv6j (R_Language)

討論串 (同標題文章)

本文引述了以下文章的的內容：

[問題] htmlParse

11年前, 05/03

完整討論串 (本文為第 2 之 2 篇)：

排序：最新先 | 最舊先 | 留言數

3

8

Re: [問題] htmlParse

11年前, 05/04

[問題] htmlParse

11年前, 05/03

在新視窗開啟完整討論串 (共2篇)

R_Language 近期熱門文章

2

2

Re: [問題] geombar分類對齊函數

1年前, 04/24

2

2

[問題] geombar分類對齊函數

1年前, 04/21

1

2

徵求R studio家教

1年前, 01/17

1

7

[問題] 請問如何多次複製1筆資料? (求救)

1年前, 11/10

4

6

[問題] 如何將資料重組 (觀察值轉成變數)？

1年前, 10/28

2

8

[問題] 可否以RODBC去連Oracle??

1年前, 08/21

1

3

[問題] augPred function 出現錯誤訊息?

2年前, 07/27

2

8

[問題] IRT相關問題

2年前, 05/01

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

15

23

[情報] 三星Z Fold8公布售價預購活動

1小時前, 07/29

44

71

[情報] 指標金士頓D5 大漲價16x2 均價15000

[ PC_Shopping ]

2小時前, 07/29

5

12

[購機] 購機選擇

2小時前, 07/29

25

85

[請益] 顯卡廠商rma會有開箱錄影嗎？

[ PC_Shopping ]

4小時前, 07/29

21

35

Re: [閒聊] 傳聞下周N卡漲20% 8月其他零件跟上

[ PC_Shopping ]

4小時前, 07/29

3

105

[菜單] 70K遊戲機 AMD 9800X3D / 9070XT

[ PC_Shopping ]

5小時前, 07/29

1

14

[菜單] 25K 升級遊戲機

[ PC_Shopping ]

5小時前, 07/29

16

60

Re: [閒聊] 微軟:8G RAM超適合日常使用der

[ PC_Shopping ]

7小時前, 07/29

更多即時熱門文章 >>

‣ 返回看板[ R_Language ] 程式

‣ 更多 celestialgod 的文章

文章代碼(AID): #1LHliv6j (R_Language)