PTT數位生活區 / Python

Re: [問題] python 抓取網頁上的資料??

看板Python作者weijr (Beware of the Monkey)時間19年前 (2007/04/20 11:06)推噓1(1推 0噓 0→)

留言1則, 1人參與討論串6/6 (看更多)

※ 引述《chy1013m1 (alex.c)》之銘言： : 用 urllib, urllib2 加上 re module 自己寫難度不高. =] 在 gmail 出現前，難度不高，但現在是 web 2.0 時代。 urllib2 應付的還是 web 1.0 的東西。要不然你就要裝一些工具或者手動分析那些 AJAX 的流程，然後直接抓 json 或者 xml，不然就要外掛一個 javascript 翻譯器。這兩個有的時候都不簡單。最簡單的還是靠 PAMIE、XPCOM、jssh 這類東西來自動控制瀏覽器比較容易弄。就算沒有 ajax 或者 javascript，而且你不想用瀏覽器自動機，form, session 的東西還是有點討厭。靠 urllib2 雖然都可以搞定，常常也不會太麻煩，但有一些現成的工具幫忙，至少多個選擇，而且可以省掉一些麻煩事。有些還可以處理一點動態 form。如果你只是抓一個網頁當然沒事，但是有時候你會想要抓一組網頁，或者依照使用者的輸入來抓不同的網頁。這個現在也很多人有需求，畢竟現在是 web 2.0 mashup 的熱潮時代。 PAMIE 程式的強度看起來不高，第一個會碰到的問題是轉碼的問題，可以把裡面的所有的str內定轉碼改成 utf-8 。 -- http://weijr-note.blogspot.com 筆記筆記 http://weijr.b81.org/poker 好膽玩家 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 134.208.26.237 ※ 編輯: weijr 來自: 134.208.26.237 (04/20 11:14)

推

04/21 01:31, , 1^F

04/21 01:31, 1^F

‣ 返回看板[ Python ] 程設

‣ 更多 weijr 的文章

文章代碼(AID): #16A2uY_J (Python)

討論串 (同標題文章)

本文引述了以下文章的的內容：

Re: [問題] python 抓取網頁上的資料??

19年前, 04/19

完整討論串 (本文為第 6 之 6 篇)：

排序：最新先 | 最舊先 | 留言數

1

1

Re: [問題] python 抓取網頁上的資料??

19年前, 04/20

Re: [問題] python 抓取網頁上的資料??

19年前, 04/19

Re: [問題] python 抓取網頁上的資料??

19年前, 04/12

Re: [問題] python 抓取網頁上的資料??

19年前, 04/12

Re: [問題] python 抓取網頁上的資料??

19年前, 04/12

[問題] python 抓取網頁上的資料??

19年前, 04/12

在新視窗開啟完整討論串 (共6篇)

Python 近期熱門文章

2

12

[問題] 公司電腦無法透過python讀取usb攝像頭

2周前, 07/08

2

11

[問題] openpyxl到底能不能調整全局Font？

2月前, 05/07

7

21

[問題] super() 與MRO 鏈斷裂問題

4月前, 02/24

3

13

[問題] vscode的debug模式不用考慮中文路徑

5月前, 02/01

1

15

[問題] skimage.io.imread()讀圖檔底色是黃色？

6月前, 12/28

2

4

[閒聊] 有人要合購股票pythony資料庫finlab嗎?

7月前, 12/23

1

1

[問題] python 3.14 free thread build

8月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

9月前, 10/22

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

4

11

[問題] 可以一鍵下命令的android手機

47分鐘前, 07/23

17

48

[問題] 長輩雙人旅日吃到飽方案？

3小時前, 07/23

9

35

[新聞]2026年Q2全球手機銷售調查

5小時前, 07/23

12

35

[討論] Fold8系列只有單實體sim + Esim？

5小時前, 07/23

7

16

[Sony] FX5 發表

5小時前, 07/23

38

77

[情報] 最近推出了一批5070核心做的5060並且漲價

[ PC_Shopping ]

7小時前, 07/23

23

63

[問題] 為什麼x300pro好像快下架一樣？

13小時前, 07/23

11

25

[討論] 注意Galaxy Z Fold 8的揚聲器位置

14小時前, 07/23

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 weijr 的文章

文章代碼(AID): #16A2uY_J (Python)