PTT數位生活區 / Python

[問題] 網頁資料擷取問題

看板Python作者ajsaak (光)時間10年前 (2015/12/24 20:16)推噓4(4推 0噓 8→)

留言12則, 3人參與討論串1/1

有幾個問題想問問，本身沒程式基礎，參考一些文章使用下面的指令 import urllib2 from bs4 import BeautifulSoup url = 'http://zh.divine-gate.wikia.com/wiki/1509' request = urllib2.Request(url) request.add_header('Accept-Encoding', 'utf-8') response = urllib2.urlopen(request) soup = BeautifulSoup(response) print soup.text 問題1.最後顯示出來，仍然有許多不需要的部分，用Infolite取得表格文字在 td跟th部分嘗試改成print soup.select('td')，但卻變成似乎有亂碼的情況問題2.現在是使用notebooks操作，如果要輸入成擋案成純文本該如何作?改成py檔執行完就直接不見了問題3.如果要大量擷取，要如何修改呢? 如：http://zh.divine-gate.wikia.com/wiki/xxxx XXXX=1~1500 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.237.87.78 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1450959371.A.535.html

推

12/24 23:41, , 1^F

12/24 23:41, 1^F

推

12/24 23:44, , 2^F

12/24 23:44, 2^F

→

12/24 23:44, , 3^F

12/24 23:44, 3^F

→

12/25 13:07, , 4^F

12/25 13:07, 4^F

→

12/25 13:07, , 5^F

12/25 13:07, 5^F

推

12/25 15:31, , 6^F

12/25 15:31, 6^F

推

12/25 15:33, , 7^F

12/25 15:33, 7^F

→

12/25 19:24, , 8^F

12/25 19:24, 8^F

→

12/25 19:25, , 9^F

12/25 19:25, 9^F

→

12/25 20:31, , 10^F

12/25 20:31, 10^F

→

12/25 20:32, , 11^F

12/25 20:32, 11^F

→

12/26 13:10, , 12^F

12/26 13:10, 12^F

‣ 返回看板[ Python ] 程設

‣ 更多 ajsaak 的文章

文章代碼(AID): #1MU-8BKr (Python)

Python 近期熱門文章

2

11

[問題] openpyxl到底能不能調整全局Font？

1月前, 05/07

7

21

[問題] super() 與MRO 鏈斷裂問題

3月前, 02/24

3

13

[問題] vscode的debug模式不用考慮中文路徑

4月前, 02/01

1

15

[問題] skimage.io.imread()讀圖檔底色是黃色？

5月前, 12/28

2

4

[閒聊] 有人要合購股票pythony資料庫finlab嗎?

5月前, 12/23

1

1

[問題] python 3.14 free thread build

7月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

8月前, 10/22

6

9

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

8月前, 10/09

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

6

13

[閒聊] AMD 5500GT CPU 送修(威健代理)

[ PC_Shopping ]

6小時前, 06/21

9

67

[菜單] 90k遊戲機

[ PC_Shopping ]

6小時前, 06/21

1

29

[菜單] 60K 程式交易工作機

[ PC_Shopping ]

7小時前, 06/20

3

59

[菜單] 30k ddr5平台升級

[ PC_Shopping ]

7小時前, 06/20

1

29

Re: [購機] 高中生想買30K中高階手機

9小時前, 06/20

8

8

[ HardwareSale ]

10小時前, 06/20

11

11

[販售] 新竹 iPhone 17 pro 256GB 銀

10小時前, 06/20

17

18

[贈送] 台中音響器材

12小時前, 06/20

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 ajsaak 的文章

文章代碼(AID): #1MU-8BKr (Python)