PTT數位生活區 / Python

[問題]Content-Encoding:gzip 爬蟲如何解壓縮

看板Python作者processior (korman)時間9年前 (2016/10/14 23:47)推噓3(3推 0噓 5→)

留言8則, 3人參與討論串1/1

最近在寫一隻爬蟲程式遇到有些網站是採用gzip壓縮後再傳送資料如果用python3 開啟 cj = Http_Cok.CookieJar() opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj)) res = urllib.request.Request(html,headers = Header_data()) data = opener.open(res).read() print(data) 都是十六進制的編碼，到網路上google 好像是要先解壓縮否則beautifulsoup也無法解讀，畢竟不是utf-8 格式網路上的解法試了也沒用大部分都是介紹pyton2的解法不知道有人知道python3要如何解嗎?? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.9.179.118 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1476460056.A.DFE.html

推

10/15 02:35, , 1^F

10/15 02:35, 1^F

推

10/15 08:08, , 2^F

10/15 08:08, 2^F

推

10/15 12:29, , 3^F

10/15 12:29, 3^F

→

10/15 12:29, , 4^F

10/15 12:29, 4^F

→

10/15 16:16, , 5^F

10/15 16:16, 5^F

→

10/15 16:17, , 6^F

10/15 16:17, 6^F

→

10/15 16:17, , 7^F

10/15 16:17, 7^F

→

10/15 16:17, , 8^F

10/15 16:17, 8^F

‣ 返回看板[ Python ] 程設

‣ 更多 processior 的文章

文章代碼(AID): #1O0FuOt- (Python)

Python 近期熱門文章

1

1

[問題] python 3.14 free thread build

2周前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

3周前, 10/22

5

8

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

1月前, 10/09

4

21

[閒聊] Python 3.13 版本是不是很爛啊！？

4月前, 07/19

15

23

[閒聊] 各位現在用os.path 還是用pathlib.Path

4月前, 07/17

5

10

[閒聊] 2024年的自我python學習

4月前, 07/17

1

2

[問題] 用Whisper AI幫我下載字幕（有酬）

7月前, 04/01

1

3

[問題] selenium 有辦法做檔案上傳嗎?

9月前, 02/03

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

7

7

[賣/台北/皆可] 威剛XPGD10 DDR4-3600 16G*2雙通

[ HardwareSale ]

3小時前, 11/16

3

28

2023時申辦的台星299終生約問題

4小時前, 11/16

-4

6

[請益] 靜電容鍵盤比較已刪文

[ PC_Shopping ]

4小時前, 11/16

20

53

[請益] 求推薦真 wifi7 三頻機 mesh

[ PC_Shopping ]

5小時前, 11/16

5

30

[討論] 你預購有虧嗎？FindX9 X300通訊行價出爐

6小時前, 11/16

19

52

[心得] Pixel跳Vivo X300 Pro簡易心得

6小時前, 11/16

8

32

[心得] iPhone 12跳槽Pixel 9心得

7小時前, 11/16

9

34

Re: [討論] 麒麟9030的效能預測

7小時前, 11/16

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 processior 的文章

文章代碼(AID): #1O0FuOt- (Python)