[問題] 如何爬blob圖檔

看板Python作者 (gaunj)時間4年前 (2020/12/12 22:40), 編輯推噓1(102)
留言3則, 1人參與, 4年前最新討論串1/1
如題 因為網頁是有跟js互動的 所以我想要用selenium爬上面的圖片 圖片部分的原始碼長這樣 <img border="0" class="hej-view__content" src="blob:" rel="nofollow">https://xxxxxxxxxxxxxx/10c7d445-5263-4bcf-b999-7e1e1a669d45"> 有一些直接貼 blob:https://XXXXXXXXX/XXXXXXXX 這串網址可以找的到圖 這類的有辦法爬下來 另一些貼網址去找只會顯示 "檔案可能已遭到移動、編輯或刪除。" 這個就不知道要怎麼爬 不知道blob的運作原理,為什麼可以讓有些圖片可以爬 有些不行 有沒有大大可以指引一下方向 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.195.45.102 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1607784002.A.5E1.html

12/13 03:16, 4年前 , 1F
可以用js 撈Object,看是寫js request送回自己的server
12/13 03:16, 1F

12/13 03:16, 4年前 , 2F
或是轉base64再用python解,或是樓下提供更好的方法XD
12/13 03:16, 2F

12/13 03:20, 4年前 , 3F
blob可以查 File API / Blob urls
12/13 03:20, 3F
文章代碼(AID): #1VrDP2NX (Python)
文章代碼(AID): #1VrDP2NX (Python)