Re: [問題] 正規表示式
import urllib
# -*- coding: utf-8 -*-
import re
def fetch(url):
page=urllib.urlopen(url).read()
print page
while True:
p=re.compile('([0-9]+-[0-9]+-[0-9]+)')
m=p.search(page).group()
print u"開獎日期:" + m
pat=re.compile(r"\d+\s+\d+\s+\d+\s+\d+\s+\d+\s+\d+")
cont=pat.search(page).group(0)
print u"開獎號碼:" + cont
p=re.compile('(>[0-9]+</font></b>)')
m=p.search(page).group()
k=re.sub(r'\D', '', m)
print u"特別號碼:" + k
# --- 下面是多加的 ---
s=p.search(page).start()+1
page=page[s:]
if not p.search(page):
break
# --- 上面是多加的 ---
url = "http://lotto.arclink.com.tw/kj_6.html"
fetch(url)
raw_input()
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.46.157.81
→
03/18 09:24, , 1F
03/18 09:24, 1F
→
03/18 23:36, , 2F
03/18 23:36, 2F
Python 近期熱門文章
PTT數位生活區 即時熱門文章