PTT數位生活區 / Python

[範例] 無名小站相簿 grabber

看板Python作者ericsk (認真的艾瑞克)時間20年前 (2005/12/26 17:17)推噓1(1推 0噓 0→)

留言1則, 1人參與討論串1/4 (看更多)

使用方法: *.py <帳號> <相簿編號> 目前的版本是搭配系統中的 wget 來抓 URL 如果大家有什麼建議改進的地方都可以提出來討論 ^^; 互相學習囉 #!/usr/bin/python import urllib2 import re import sys import os global addr addr = "http://www.wretch.cc/album" def get_pic(path): url = re.sub('&', r'&', addr+path) r = urllib2.Request(url) r.add_header('Referer', addr) r.add_header('User-Agent', 'Mozilla 5.0') cont = urllib2.urlopen(r) c = cont.readlines() for line in c: if re.match('.*<img id=\'DisplayImage\'.*?></a>', line): mat = re.findall('(http.*?)\'', line) if mat: os.system('/usr/bin/wget --header=\'Referer: http://www.wretch.cc/album\' --header=\'User-Agent: Mozilla 5.0\' '+mat[0]) def grab(lines): flag = 0; for line in lines: if re.match(".*show.php.*", line): flag = flag +1 mat = re.findall('<a href=".(.*?)" ><.*?</a>', line) if mat: get_pic(mat[0]) if flag == 0: return True else: return False if __name__ == "__main__": user = sys.argv[1] book = sys.argv[2] url = addr+"/album.php?id="+user+"&book="+book i = 1 while True: url2 = url+"&page="+str(i) req = urllib2.Request(url2) req.add_header('Referer', addr) req.add_header('User-Agent', 'Mozilla 5.0') page = urllib2.urlopen(req) if (grab(page.readlines())): break; i = i + 1 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.31.143

推

12/26 17:42, , 1^F

12/26 17:42, 1^F

‣ 返回看板[ Python ] 程設

‣ 更多 ericsk 的文章

文章代碼(AID): #13hxKz3a (Python)

討論串 (同標題文章)

完整討論串 (本文為第 1 之 4 篇)：

排序：最新先 | 最舊先 | 留言數

Re: [範例] 無名小站相簿 grabber

15年前, 05/29

0

1

Re: [範例] 無名小站相簿 grabber

15年前, 05/29

Re: [範例] 無名小站相簿 grabber

20年前, 02/15

1

1

[範例] 無名小站相簿 grabber

20年前, 12/26

在新視窗開啟完整討論串 (共4篇)

Python 近期熱門文章

2

12

[問題] 公司電腦無法透過python讀取usb攝像頭

2周前, 07/08

2

11

[問題] openpyxl到底能不能調整全局Font？

2月前, 05/07

7

21

[問題] super() 與MRO 鏈斷裂問題

4月前, 02/24

3

13

[問題] vscode的debug模式不用考慮中文路徑

5月前, 02/01

1

15

[問題] skimage.io.imread()讀圖檔底色是黃色？

6月前, 12/28

2

4

[閒聊] 有人要合購股票pythony資料庫finlab嗎?

7月前, 12/23

1

1

[問題] python 3.14 free thread build

8月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

9月前, 10/22

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

7

17

[問題] 為什麼x300pro好像快下架一樣？

6小時前, 07/23

4

30

[菜單] 35k遊戲機

[ PC_Shopping ]

8小時前, 07/22

3

11

[問題] Sony A6700 螢幕問題

9小時前, 07/22

4

14

[請益] 威剛雙通道送修

[ PC_Shopping ]

13小時前, 07/22

68

124

[Live] Samsung Galaxy Unpacked July 2026

13小時前, 07/22

20

46

[賣/全國/皆可] 金士頓FURYM21TBSSD SFYRS/1000G

[ HardwareSale ]

14小時前, 07/22

5

5

[賣/台中/面交] ddr4-16g/8g/3060ti/12400F

[ HardwareSale ]

14小時前, 07/22

9

14

[開箱] 保銳REVOLUTION III性價比金靜冰核白化版

[ PC_Shopping ]

15小時前, 07/22

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 ericsk 的文章

文章代碼(AID): #13hxKz3a (Python)