[問題] 無法把網站的圖片下載下來
最近在練習 驗證碼辨識
想說試試看自己測試其他網站能不能成功
結果光是下載驗證碼圖片就困擾我一陣子啦
同樣的code
在gztown就抓得到
https://pt.gztown.net/login.php
但是在學校網站卻抓不到
https://www.ais.tku.edu.tw/EleCos/login.aspx
想請教該如何解決?
code如下(從#1QFyrfBX (Python)改寫的):
import shutil
import requests
import time
from bs4 import BeautifulSoup
SAVEPATH = "./data/manual_label/"
url = "https://pt.gztown.net/login.php"
#url = 'http://railway1.hinet.net/ImageOut.jsp'
for i in range(1, 3000):
#先抓出驗證碼圖片的網址 img_url
r = requests.get(url, stream = True)
soup = BeautifulSoup(r.text, 'html.parser')
img = soup.find_all('img')
src = img[1].get('src')
img_url = "https://pt.gztown.net/" + src
response = requests.get(img_url, stream=True)
with open(SAVEPATH + str(i) + '.jpg', 'wb') as out_file:
shutil.copyfileobj(response.raw, out_file)
del response
time.sleep(0.1)
謝謝各位前輩
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.32.56.155
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1552056932.A.27A.html
推
03/08 23:15,
6年前
, 1F
03/08 23:15, 1F
推
03/09 01:13,
6年前
, 2F
03/09 01:13, 2F
→
03/09 08:01,
6年前
, 3F
03/09 08:01, 3F
→
03/09 08:02,
6年前
, 4F
03/09 08:02, 4F
→
03/09 11:48,
6年前
, 5F
03/09 11:48, 5F
推
03/09 16:48,
6年前
, 6F
03/09 16:48, 6F
Python 近期熱門文章
PTT數位生活區 即時熱門文章