[問題] 爬網頁抓影片的疑問

看板Python作者 (yoshito)時間9年前 (2016/04/21 18:15), 編輯推噓6(6016)
留言22則, 3人參與, 最新討論串1/1
各位板友好, 最近看youtube教學 練習用Python抓圖片、影片、分析網站 import requests res = requests.get(' http://www.maplestage.com/episode/139279/%E4%B8%80%E8%A2%8B%E5%A5%B3%E7%8E%8B+20160420+%E9%81%93%E9%AB%98%E4%B8%80%E5%B0%BA+%E9%AD%94%E9%AB%98%E4%B8%80%E4%B8%88+%E5%A4%AB%E5%A6%BB%E7%94%9F%E6%B4%BB%E8%AB%9C%E5%B0%8D%E8%AB%9C!/') print res.text 我是找maplestage練習抓上面的影片 像上面的影片是dailymotion的 可是在res.text裡面內容找不到相關的影片連結 小弟不太懂網頁裡面語言 所以試了很就可是還是無法成功 所以想知道是不是有方法找到影片的連結來下載 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.33.62 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1461233734.A.825.html

04/21 18:21, , 1F
幾個問題希望你回答,你這網頁裡有許多影片,請問你要
04/21 18:21, 1F

04/21 18:21, , 2F
抓哪支影片?
04/21 18:21, 2F

04/21 18:24, , 3F
所以你目標是抓影片聯結還是下載影片?
04/21 18:24, 3F

04/21 18:35, , 4F
希望能直接抓下影片,例如能下載某個節目某一集
04/21 18:35, 4F

04/21 20:10, , 5F
影片網址是這個嗎?http://goo.gl/okaoP4
04/21 20:10, 5F

04/21 20:10, , 6F
ptt站方不給貼 ppt.cc 只好貼 goo.gl 的 orz
04/21 20:10, 6F

04/21 20:10, , 7F
存取遭到拒絕耶@@?!
04/21 20:10, 7F

04/21 20:12, , 8F
http://pastebin.com/7yqGJCWv 我把影片網址貼這
04/21 20:12, 8F

04/21 20:14, , 9F
呃,我知道原因了
04/21 20:14, 9F

04/21 20:14, , 10F
我換了個 IP 再去存取這個網址是 403
04/21 20:14, 10F

04/21 20:14, , 11F
他那個網址是只能讓我的 IP 存取,所以你才會 forbidden
04/21 20:14, 11F

04/21 20:16, , 12F
總之,他把影片網址藏在這段 http://imgur.com/xyET58S
04/21 20:16, 12F

04/21 20:17, , 13F
你找看看囉,找的到影片網址下載就容易了
04/21 20:17, 13F

04/21 20:37, , 14F
那用什麼解析這些網址,這是能轉換的嗎?
04/21 20:37, 14F

04/21 20:40, , 15F
你圖片裡上面那一行的網址裡面的HTML就可以只接找到
04/21 20:40, 15F

04/21 20:40, , 16F
mp4的連結
04/21 20:40, 16F

04/21 20:45, , 17F
可以試試 lxml 然後用 xpath 來找到你要的東西
04/21 20:45, 17F

04/21 20:46, , 18F
BeautifulSoup 好像也可以,但是我沒有用過
04/21 20:46, 18F

04/21 20:55, , 19F
非常感謝,我一開始試soup但是總覺得好像轉換後有些
04/21 20:55, 19F

04/21 20:56, , 20F
找不到,不過我現在是先從網站裡面找到.../embed/..
04/21 20:56, 20F

04/21 20:56, , 21F
的影片連結,再從新的網站去找下載連結
04/21 20:56, 21F

04/21 20:57, , 22F
有點麻煩,但是先這樣做,希望版友能指點 :)
04/21 20:57, 22F
文章代碼(AID): #1N6AX6Wb (Python)
文章代碼(AID): #1N6AX6Wb (Python)