Re: [問題] 抓取網頁遇到的問題2

看板Python作者 (baker)時間14年前 (2010/10/07 15:28), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串2/2 (看更多)
可以使用pattern定義出你要擷取資料的HTML結構,例 pattern_retrieval = ['html/body/table/tr/td'] 把條件式寫在handle_data裡面 if "/".join(self._level_stack) in pattern_retrieval: #儲存資料 我有寫過抓取google snippets的程式, 有問題可以mail給我sunrise0406@hotmail.com,互相討論。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.166.81
文章代碼(AID): #1ChNQ3qp (Python)
文章代碼(AID): #1ChNQ3qp (Python)