[資訊] HTML解析庫 requests-html

看板Python作者 (Vi)時間7年前 (2018/03/15 17:47), 編輯推噓3(302)
留言5則, 4人參與, 7年前最新討論串1/1
GithubL:https://github.com/kennethreitz/requests-html 文件:http://html.python-requests.org/ 剛在github看到 覺得很實用就分享一下 這套件可以用來解析html 支援javascript render 不需要特地用selenium就能取得js渲染過的html 也支援複雜的CSS選擇器與xpath語法 還能自動翻頁,我不知道這怎麼實現的 還滿厲害的 之前都是用xpath搭配正規表達式硬幹 這套件看起來還滿方便的 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.218.40.109 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1521107232.A.FC1.html

03/15 18:06, 7年前 , 1F
自動翻頁就是用猜的, 沒什麼魔法
03/15 18:06, 1F

03/15 21:42, 7年前 , 2F
有支援JS有點猛欸 為什麼啊?!
03/15 21:42, 2F

03/15 23:00, 7年前 , 3F
用了pyppeteer 是Puppeteer的非官方py版本
03/15 23:00, 3F

03/15 23:01, 7年前 , 4F
會下載安裝Chromium~~~
03/15 23:01, 4F

03/15 23:57, 7年前 , 5F
推推
03/15 23:57, 5F
文章代碼(AID): #1Qga4W_1 (Python)
文章代碼(AID): #1Qga4W_1 (Python)