[問題] selenium取網頁內容的問題

看板Python作者 (我是香民)時間9年前 (2016/10/20 17:52), 編輯推噓1(102)
留言3則, 2人參與, 最新討論串1/1
請問一下如何使用selenium取得瀏覽器出現畫面的完整文字內容? 單純用webdriver的page_source是不是無法完整取得某些動態網頁的內容? 我遇到的問題是瀏覽器載入頁面後page_source跟在瀏覽器中看到的頁面原始碼不一樣 https://goo.gl/wMi3LO 這是我嘗試載入的網頁 程式碼如下 driver = webdriver.Chrome("driver path") wait = WebDriverWait(driver, 30); driver.get(url) try: WebDriverWait(driver, delay).until(EC.presence_of_element_located((By.XPATH, '//*[@class="content__article-body from-content-api js-article__body"]'))) html = driver.page_source print "Page is ready!" except TimeoutException: print "Loading took too much time!" 把html變數內容存下來卻沒有我設定等待其出現的網頁元件 試過phantomjs也是一樣的結果 請問一下應該要怎麼做才會取得完整的畫面原始碼 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.51.164.216 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1476957128.A.11D.html

10/22 03:11, , 1F
之前用phantomJS可以取得完整內容
10/22 03:11, 1F

10/22 13:02, , 2F
我用Firefox得到的page_source中有你要找的class喔
10/22 13:02, 2F

10/22 13:02, , 3F
可能是你中間程式碼的問題?
10/22 13:02, 3F
文章代碼(AID): #1O29F84T (Python)
文章代碼(AID): #1O29F84T (Python)