[問題] 用python做parse

看板Python作者 (是黑是白)時間13年前 (2012/06/04 21:57), 編輯推噓2(206)
留言8則, 6人參與, 最新討論串1/1
之前沒學過python google到的教學文章有範例 但卻不懂原理.. 請問一下我今天假使要parse證交所的收盤價 http://0rz.tw/n8qLj 是要先自己分析網頁的原始碼 找出我要的資料在哪裡 然後再parse嗎? 原始碼長得像這樣子http://ppt.cc/IhfX 請問該如何做parse 麻煩給點指導 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.116.243.66

06/04 22:17, , 1F
基本上可搭配lxml,將html丟進去分析,然後用xpath娶你
06/04 22:17, 1F

06/04 22:17, , 2F
要的部分
06/04 22:17, 2F

06/04 22:39, , 3F
我都很笨的用urllib把整篇網頁抓下來再抓keyword把東西切開
06/04 22:39, 3F

06/04 22:55, , 4F
我也是抓證交所的資料,可以直接抓csv的檔案再parse比較簡
06/04 22:55, 4F

06/04 22:55, , 5F
單,不過要花點時間hack網址:)
06/04 22:55, 5F

06/05 07:50, , 6F
要不要試試這個套件 http://pypi.python.org/pypi/grs
06/05 07:50, 6F

06/06 14:30, , 7F
我跟3樓一樣,懶的用工具了,反正parse起來不難
06/06 14:30, 7F

06/23 07:58, , 8F
lxml, BeautifulSoup, Scrapy
06/23 07:58, 8F
文章代碼(AID): #1FpBwtp0 (Python)
文章代碼(AID): #1FpBwtp0 (Python)