討論串[分享] 更進一步使用RSelenium抓取PTT內容與通知
共 3 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者wanson時間7年前 (2016/07/24 01:52), 編輯資訊
0
1
1
內容預覽:
最近看到有人教學使用RSelenium 抓取PTT的內容https://www.youtube.com/watch?v=PYy5C9IIgp8我自學了一下發現的確可行我自己本身因為有搭共乘的需求特別搭乘的是比較少人提供的部分所以我想更進一步使用這個方法並且進一步通知上述網址的教學只能將爬到的檔案存成
(還有963個字)

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者celestialgod (天)時間7年前 (2016/07/24 17:56), 7年前編輯資訊
0
1
6
內容預覽:
第一個問題的話就是抓上一頁的按鈕連結,然後再慢慢往前轉就好,下面舉例. RSelenium是滿好入手的工具. 抓到感覺後就可以慢慢開始用httr, xml2去抓網頁,速度會相對快很多. 舉例如下:. (stri_conv只用在windows系統,linux/mac可以不需要). library(ht
(還有1874個字)

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者wanson時間7年前 (2016/07/24 19:00), 編輯資訊
0
1
2
內容預覽:
謝謝回應. 我嘗試使用repeat 去抓car-pol 台北到高雄的車次. 另外我使用一個old 資料夾當作先前的最後版本,在新的搜尋時候. 會anti join 但由於他抓出來的都是list 所以我不得以只能使用setdif. 不知道有沒有更好的方式. 如果有搜尋到相關的 r會自動寄信給我. 以上
(還有1626個字)
首頁
上一頁
1
下一頁
尾頁