討論串(共2篇) - [問題] 抓取網頁遇到的問題2 - 看板Python

看板 [ Python ]

討論串[問題] 抓取網頁遇到的問題2

共 2 篇文章

排序：最新先 | 最舊先 | 留言數 | 推文總分

內容預覽：開啟 | 關閉 | 只限未讀

首頁

尾頁

Re: [問題] 抓取網頁遇到的問題2

推噓0(0推 )留言0則，0人參與作者sunrise0406 (baker)時間15年前 (2010/10/07 15:28)資訊

內容預覽:

可以使用pattern定義出你要擷取資料的HTML結構，例. pattern_retrieval = ['html/body/table/tr/td']. 把條件式寫在handle_data裡面. if "/".join(self._level_stack) in pattern_retrieval

[問題] 抓取網頁遇到的問題2

推噓1(1推 )留言3則，0人參與作者arlu (arlu)時間16年前 (2010/08/27 15:45)資訊

內容預覽:

大家好，. 另外有一個問題想請教各位。. 假設我要用HTMLParser抓網頁的資料，. 我知道其內建有幾個函數可以使用，像是handle_startendtag、handle_starttag、. handle_endtag、handle_data…等。. 假設我想要抓的是以下"span titl

(還有94個字)

首頁

尾頁