[問題] 有沒有高手可以直接教我爬抓資料2000p已刪文

看板Python作者 (記憶拼圖)時間5年前 (2020/07/14 09:37), 編輯推噓-2(2423)
留言29則, 15人參與, 5年前最新討論串1/1
想要找某網站的影片資料 希望有高手大可以幫我 如果可以的話 若不嫌棄 願意以2000P幣 表達感謝(若難度真的很大 願意加倍p幣 4000p) 希望有高手大大可以直接教我 怎麼爬抓資料 因為不太可能學程式 但又想抓取某網站的全部資料 但是網站應該是採 以下這兩種網址的格式的範例 (先說明https://v1.abcde.com/ 並非我要找的網站 但網址不方便公開寫出來 所以用abcde代替掉原本的英文字) (大概還有兩三百個類似的網址的影片 但是我因為不知道數字規律是什麼 所以無法觀看 或下載下來) 第1種 https://v1.abcde.com/u/video_url/2020/0318/1584535407176.mp4 https://v1.abcde.com/u/video_url/2020/0318/1584535618170.mp4 第2種 https://v1.abcde.com/micro-course/u/2020/0703/160954788558.mp4 https://v1.abcde.com/micro-course/u/2020/0702/150101129441.mp4 https://v1.abcde.com/micro-course/u/2020/0702/131029435944.mp4 https://v1.abcde.com/micro-course/u/2020/0702/150753855576.mp4 https://v1.abcde.com/micro-course/u/2020/0702/150921758347.mp4 abcde是我亂打 打成別的英文字 來代替原本我要找的那個網站的5個英文字 因為不方便公開 如果有哪個高手大大願意幫助我 我在私信那個網址 因為我點開原來的 https://v1.abcde.com 開頭的主網址 只會顯示 This XML file does not appear to have any style information associated with it. The document tree is shown below. <Error> <Code>AccessDenied</Code> <Message>The bucket you access does not belong to you.</Message> 這個網站 因為不會直接顯示出可以點取的物件 我要找的那些影片網址 都是未知的隨機數字組成 然後藏在以上這兩個網址規律 的子目錄下 頂多能從2020得知是年份的規律 和 幾月幾日 後面檔名 真的看不出什麼規律 但是我已知的就是都是mp4的檔案 因為是未知網址 所以大概要用爬蟲設定慢慢找這樣 大概我也知道 爬抓也可能會被防禦被抓到是爬蟲的ip而ban掉對吧 但是看過程式教學 覺得還是太高深 沒時間花兩個月以上去研究這個程式 所以想請問有哪個高手大 可以直接幫我 或教我怎麼爬抓 如果難度很大 本人願意在更多加倍p幣交換 當作答謝 再請麻煩私信我~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 116.241.28.55 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1594690663.A.626.html

07/14 10:03, 5年前 , 1F
你不如直接出錢委託還比較實在迅速XD
07/14 10:03, 1F

07/14 12:21, 5年前 , 2F
p幣實在讓人不心動
07/14 12:21, 2F

07/14 12:34, 5年前 , 3F
P幣能幹嘛 消費券?
07/14 12:34, 3F

07/14 13:06, 5年前 , 4F
哈哈
07/14 13:06, 4F

07/14 13:47, 5年前 , 5F
是要要爬a片嗎 網路上的影片有甚麼好不公開的==
07/14 13:47, 5F

07/14 15:08, 5年前 , 6F
P幣…
07/14 15:08, 6F

07/14 18:12, 5年前 , 7F
本人目前回歸窮學生狀態 可能只能出得起P幣 對不起要幫我的
07/14 18:12, 7F

07/14 18:14, 5年前 , 8F
人了 或者再以運動類技能交換 (台中市~
07/14 18:14, 8F

07/14 18:45, 5年前 , 9F
直接把網址秀出來搞不好就有人閒閒沒事幫你寫?
07/14 18:45, 9F

07/14 19:29, 5年前 , 10F
說說網址阿
07/14 19:29, 10F

07/14 19:29, 5年前 , 11F
回你了。可以用
07/14 19:29, 11F

07/14 19:29, 5年前 , 12F

07/14 19:29, 5年前 , 13F
裡面有程式碼給你參考。也有做好的執行檔
07/14 19:29, 13F

07/14 19:33, 5年前 , 14F
看錯誤訊息起來是AWS S3的 API 沒有索引有點難搞
07/14 19:33, 14F

07/14 19:33, 5年前 , 15F
看看有沒有辦法從其他地方找到索引吧
07/14 19:33, 15F

07/14 20:18, 5年前 , 16F
樓上alvinlin大 好像誤會我的意思了 就已知的網址 我都可以
07/14 20:18, 16F

07/14 20:19, 5年前 , 17F
下載 但是就是想要知道未知字串的網址 只知道大概的規律
07/14 20:19, 17F

07/14 20:20, 5年前 , 18F
所以想請教 有沒有能直接爬出所有藏在主網址下面所有網址
07/14 20:20, 18F

07/14 20:20, 5年前 , 19F
的影片
07/14 20:20, 19F

07/14 20:21, 5年前 , 20F
我有用直接複製整個網站的程式 但好像無法複製
07/14 20:21, 20F

07/14 20:25, 5年前 , 21F
不過還是謝謝alvinlin大和tuch大 跟樓上幾位
07/14 20:25, 21F

07/14 22:24, 5年前 , 22F
不客氣^^。沒幫上什麼忙
07/14 22:24, 22F

07/14 22:32, 5年前 , 23F
另外FYI就是後面的網址看起來是timestamp,到毫秒。但我
07/14 22:32, 23F

07/14 22:32, 5年前 , 24F
覺得還是沒什麼幫助。
07/14 22:32, 24F

07/14 22:52, 5年前 , 25F
捐個血就可以拿到5000p幣 你給個4000p真沒吸引力
07/14 22:52, 25F

07/15 12:15, 5年前 , 26F
你不如乾脆一點講清楚是哪個網站,搞不好就有高手回你
07/15 12:15, 26F

07/15 12:15, 5年前 , 27F
07/15 12:15, 27F

07/15 16:59, 5年前 , 28F
標題是教爬資料,內文則是不太可能學,好矛盾哦
07/15 16:59, 28F

07/15 20:56, 5年前 , 29F
沒誠意
07/15 20:56, 29F
文章代碼(AID): #1V3GndOc (Python)
文章代碼(AID): #1V3GndOc (Python)