Re: [問題] 擷取氣象局定時發布的資料

看板Python作者 (carl)時間12年前 (2013/07/17 22:14), 編輯推噓2(203)
留言5則, 2人參與, 最新討論串2/2 (看更多)
※ 引述《CCpiano (鋼琴社公告用id)》之銘言: : 請問各位關於python擷取網頁的問題 : 因為我對颱風資訊還滿有興趣的 : 因此我想要蒐集每次颱風的所有颱風警報單內容 : 而在中央氣象局的網頁上 : http://www.cwb.gov.tw/V7/prevent/warning/w23.htm? : 這是颱風警報(現在是熱帶性低氣壓特報)會出現的網址 : 我想要寫python program讓他自動在發報時間後幫我從網站上取出警報單的內容 : 像現在就是: : 發布時間:2013/07/16 22:31 : 熱帶性低氣壓1002百帕,在北緯16.2度,東經123.7度,即在菲律賓東方海 : 面,向西北移動,時速15公里,未來有發展為輕度颱風的趨勢,本局正密切注意中;請 : 在巴士海峽航行及作業船隻特別注意。 : 我用的是python 3.3.2 : 我爬了文可以使用urllib.request : 但我試過之後發現他沒有幫我擷取到以上我想要的資訊內容 : 請問各位我該如何做到這點? : 還是氣象局網頁不讓別人這麼做@@ 因為你的前提有錯誤~~ 我剛用瀏覽器開 可以看到網頁的編碼的確是utf-8 你印出來的是字元本身(這我不太會講XD) 用utf-8 decode後 再印出來就OK了 print(webcontent.decode('utf-8')) -- http://blog.carlcarl.tw -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.137.91.158

07/17 23:52, , 1F
謝謝你!! 可是我發現就是中間警報單內容那塊沒有被取下來
07/17 23:52, 1F

07/17 23:53, , 2F
耶><
07/17 23:53, 2F

07/18 02:49, , 3F
因為那些部分是另外做request的 要執行js後才會有
07/18 02:49, 3F

07/18 02:51, , 4F
像是: http://uca.tw/xl1tn1 就是其中一個
07/18 02:51, 4F

07/19 17:23, , 5F
謝謝!!我成功讀到了!!:)
07/19 17:23, 5F
文章代碼(AID): #1HvgQyzi (Python)
討論串 (同標題文章)
文章代碼(AID): #1HvgQyzi (Python)