討論串(共6篇) - [問題] python 抓取網頁上的資料?? - 看板Python

看板 [ Python ]

討論串[問題] python 抓取網頁上的資料??

共 6 篇文章

排序：最新先 | 最舊先 | 留言數 | 推文總分

內容預覽：開啟 | 關閉 | 只限未讀

首頁

尾頁

Re: [問題] python 抓取網頁上的資料??

推噓1(1推 )留言1則，0人參與作者weijr (Beware of the Monkey)時間19年前 (2007/04/20 11:06)資訊

內容預覽:

在 gmail 出現前，難度不高，但現在是 web 2.0 時代。. urllib2 應付的還是 web 1.0 的東西。. 要不然你就要裝一些工具或者手動分析那些 AJAX 的流程，. 然後直接抓 json 或者 xml，不然就要外掛一個 javascript 翻譯器。. 這兩個有的時候都不簡單。

(還有380個字)

Re: [問題] python 抓取網頁上的資料??

推噓0(0推 )留言0則，0人參與作者chy1013m1 (alex.c)時間19年前 (2007/04/19 07:47)資訊

內容預覽:

用 urllib, urllib2 加上 re module 自己寫難度不高. =]. --. alex.c. --. ※ 發信站: 批踢踢實業坊(ptt.cc). ◆ From: 142.150.78.68.

Re: [問題] python 抓取網頁上的資料??

推噓0(0推 )留言0則，0人參與作者weijr (Beware of the Monkey)時間19年前 (2007/04/12 22:23)資訊

內容預覽:

有點舊的資訊，原文請參考. google: web-app-testing-with-python-test-1. Examples of browser simulators:. * mechanize (Python), which is based on WWW::mechanize (Per

(還有370個字)

Re: [問題] python 抓取網頁上的資料??

推噓0(0推 )留言0則，0人參與作者kxeme (演算法可以吃嗎?)時間19年前 (2007/04/12 14:30)資訊

內容預覽:

有個叫 mechanize 的 module, 是學 perl 的 WWW::Mechanize. (雖然我還是習慣用 WWW::Mechanize 就是了...). http://wwwsearch.sourceforge.net/mechanize/. --. ※ 發信站: 批踢踢實業坊(ptt

Re: [問題] python 抓取網頁上的資料??

推噓0(0推 )留言0則，0人參與作者Lucemia (生の直感、死の予感)時間19年前 (2007/04/12 12:49)資訊

內容預覽:

urllib 之類的工具可以抓網頁，依網頁的情況困難度有所不同. 有些情況下不使用python，以Firefox Addons or greaseMonkey. 更容易做到. --. ※ 發信站: 批踢踢實業坊(ptt.cc). ◆ From: 140.96.100.37.

首頁

尾頁