[心得] 終於把蔡XX網站的影片爬下來了~心得分享~

看板Python作者 (黃~)時間7年前 (2018/01/28 16:12), 編輯推噓1(106)
留言7則, 4人參與, 7年前最新討論串1/1
大家好,這是我之前下載影片時碰到的困境 https://goo.gl/rs7tQG 發現解法了!!! 其實完全不用管segment,其實網站把影片url藏在iframe的javascript中 那我是怎麼找到的呢? 直接在chrome dev tools的element中ctrl+F,打上.mp4!!! https://imgur.com/a/eizXW 以下是我的程式碼(別忘了driver.switch_to.frame(0)來抓iframe中的javascript原始碼) https://pastebin.com/BwWZ71m4 謝謝!!! PS1.看完大數學堂了,不過針對scrapy有些比較難的部分(ex.downloader middleware) 只有找到幾支免費的教學影片,還有人推薦嗎?感謝! PS2.有人有其他進階的爬蟲下載教學,也歡迎分享!!! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.82.26.105 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1517127167.A.88D.html

01/28 21:40, 7年前 , 1F
scrapy直接看官方文件 或是買書吧
01/28 21:40, 1F

01/28 23:40, 7年前 , 2F
官方文件有時候看不太懂ㄝ
01/28 23:40, 2F

01/28 23:41, 7年前 , 3F
影片比較容易吸收~
01/28 23:41, 3F

02/02 20:42, 7年前 , 4F
那如果影片的src是沒有副檔名的呢?
02/02 20:42, 4F

02/02 20:42, 7年前 , 5F
來源點進去都是直接access denied這種我搞好久還是
02/02 20:42, 5F

02/02 20:42, 7年前 , 6F
都抓不下來
02/02 20:42, 6F

03/06 04:35, 7年前 , 7F
03/06 04:35, 7F
文章代碼(AID): #1QRON_YD (Python)
文章代碼(AID): #1QRON_YD (Python)