看板 [ Python ]
討論串[問題] python 抓取網頁上的資料??
共 6 篇文章
首頁
上一頁
1
2
下一頁
尾頁

推噓1(1推 0噓 0→)留言1則,0人參與, 最新作者weijr (Beware of the Monkey)時間18年前 (2007/04/20 11:06), 編輯資訊
0
0
2
內容預覽:
在 gmail 出現前,難度不高,但現在是 web 2.0 時代。. urllib2 應付的還是 web 1.0 的東西。. 要不然你就要裝一些工具或者手動分析那些 AJAX 的流程,. 然後直接抓 json 或者 xml,不然就要外掛一個 javascript 翻譯器。. 這兩個有的時候都不簡單。
(還有380個字)

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者chy1013m1 (alex.c)時間18年前 (2007/04/19 07:47), 編輯資訊
0
0
0
內容預覽:
用 urllib, urllib2 加上 re module 自己寫難度不高. =]. --. alex.c. --. 發信站: 批踢踢實業坊(ptt.cc). ◆ From: 142.150.78.68.

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者weijr (Beware of the Monkey)時間18年前 (2007/04/12 22:23), 編輯資訊
0
0
2
內容預覽:
有點舊的資訊,原文請參考. google: web-app-testing-with-python-test-1. Examples of browser simulators:. * mechanize (Python), which is based on WWW::mechanize (Per
(還有370個字)

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者kxeme (演算法可以吃嗎?)時間18年前 (2007/04/12 14:30), 編輯資訊
0
0
1
內容預覽:
有個叫 mechanize 的 module, 是學 perl 的 WWW::Mechanize. (雖然我還是習慣用 WWW::Mechanize 就是了...). http://wwwsearch.sourceforge.net/mechanize/. --. 發信站: 批踢踢實業坊(ptt

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者Lucemia (生の直感、死の予感)時間18年前 (2007/04/12 12:49), 編輯資訊
0
0
0
內容預覽:
urllib 之類的工具可以抓網頁,依網頁的情況困難度有所不同. 有些情況下不使用python,以Firefox Addons or greaseMonkey. 更容易做到. --. 發信站: 批踢踢實業坊(ptt.cc). ◆ From: 140.96.100.37.
首頁
上一頁
1
2
下一頁
尾頁