看板 [ Python ]
討論串[問題] 抓取網頁遇到的問題2
共 2 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者sunrise0406 (baker)時間14年前 (2010/10/07 15:28), 編輯資訊
0
0
0
內容預覽:
可以使用pattern定義出你要擷取資料的HTML結構,例. pattern_retrieval = ['html/body/table/tr/td']. 把條件式寫在handle_data裡面. if "/".join(self._level_stack) in pattern_retrieval

推噓1(1推 0噓 2→)留言3則,0人參與, 最新作者arlu (arlu)時間15年前 (2010/08/27 15:45), 編輯資訊
0
0
0
內容預覽:
大家好,. 另外有一個問題想請教各位。. 假設我要用HTMLParser抓網頁的資料,. 我知道其內建有幾個函數可以使用,像是handle_startendtag、handle_starttag、. handle_endtag、handle_data…等。. 假設我想要抓的是以下"span titl
(還有94個字)
首頁
上一頁
1
下一頁
尾頁