Re: [問題] Java爬延遲加載的網頁

看板java作者 (Neil-lin)時間10年前 (2015/05/05 20:10), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串2/2 (看更多)
※ 引述《bobyang79 (蔥哥)》之銘言: : 目前主要是想爬YouTube上的聊天室內容 : 目前看網頁原始碼感覺應該是可以爬的 : Youtube設計上內容一開始是"加載中..." : 要過一段時間才會變成聊天室內容 : 但目前用Java或Jsoup去爬好像都會抓到網頁一開始資料 : "加載中..." : 不知道有沒有辦法做延遲讀取之類的 : 有嘗試過先connect後sleep(10000)再get : 不過似乎還是不行 YouTube 留言是JavaScript 動態的,存網頁下來是看不到動態資料你可以用selenium 套 件試試, 在用jsoup拆解html -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.235.208 ※ 文章網址: https://www.ptt.cc/bbs/java/M.1430827853.A.8A3.html
文章代碼(AID): #1LIBDDYZ (java)
討論串 (同標題文章)
文章代碼(AID): #1LIBDDYZ (java)