Re: [問題] Java爬延遲加載的網頁
※ 引述《bobyang79 (蔥哥)》之銘言:
: 目前主要是想爬YouTube上的聊天室內容
: 目前看網頁原始碼感覺應該是可以爬的
: Youtube設計上內容一開始是"加載中..."
: 要過一段時間才會變成聊天室內容
: 但目前用Java或Jsoup去爬好像都會抓到網頁一開始資料
: "加載中..."
: 不知道有沒有辦法做延遲讀取之類的
: 有嘗試過先connect後sleep(10000)再get
: 不過似乎還是不行
YouTube 留言是JavaScript 動態的,存網頁下來是看不到動態資料你可以用selenium 套
件試試, 在用jsoup拆解html
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.235.208
※ 文章網址: https://www.ptt.cc/bbs/java/M.1430827853.A.8A3.html
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
java 近期熱門文章
PTT數位生活區 即時熱門文章