PTT數位生活區 / Python

[問題] 網路爬蟲後的資料分析

看板Python作者ansi54 (笑笑生)時間10年前 (2015/12/02 14:35)推噓1(1推 0噓 4→)

留言5則, 3人參與討論串1/1

大家好小弟近來自學python的網路爬蟲抓取網頁的html檔後用beautifulsoup資料分析我的目的在於要抓取關鍵字搜索後的資料（一頁有50筆）目前發現一個問題無法解決（也google不到）因為我要抓的網頁資料在原始碼上的編排有做手腳我要抓的title它有些是編排為： "標題" 有些是："標題 " 因為這個雙引號位置的關係，使得我抓出來的資料編排就不一致請問各位先進我要如何修改我的程式才能讓我抓出來的資料編排一致？謝謝小弟的程式如下： for item in range (0, 50): title = soup.findAll('a',{'class':'t'})[item].get_text().strip() date_t = soup.findAll('span',{'class':'date'})[item].get_text() print date_t,"．",title -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.197.38 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1449038152.A.43F.html

推

12/02 20:14, , 1^F

12/02 20:14, 1^F

→

12/03 09:12, , 2^F

12/03 09:12, 2^F

→

12/03 22:50, , 3^F

12/03 22:50, 3^F

→

12/03 22:50, , 4^F

12/03 22:50, 4^F

→

12/04 09:05, , 5^F

12/04 09:05, 5^F

‣ 返回看板[ Python ] 程設

‣ 更多 ansi54 的文章

文章代碼(AID): #1MNf58G_ (Python)

Python 近期熱門文章

2

11

[問題] openpyxl到底能不能調整全局Font？

1月前, 05/07

7

21

[問題] super() 與MRO 鏈斷裂問題

3月前, 02/24

3

13

[問題] vscode的debug模式不用考慮中文路徑

4月前, 02/01

1

15

[問題] skimage.io.imread()讀圖檔底色是黃色？

5月前, 12/28

2

4

[閒聊] 有人要合購股票pythony資料庫finlab嗎?

5月前, 12/23

1

1

[問題] python 3.14 free thread build

7月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

8月前, 10/22

6

9

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

8月前, 10/09

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

4

12

[菜單] 90k遊戲機

[ PC_Shopping ]

4小時前, 06/21

1

27

Re: [購機] 高中生想買30K中高階手機

8小時前, 06/20

8

8

[ HardwareSale ]

9小時前, 06/20

11

11

[販售] 新竹 iPhone 17 pro 256GB 銀

9小時前, 06/20

16

16

[贈送] 台中音響器材

11小時前, 06/20

5

39

[徵/台中] 2050 3050 4050 筆電不要TUF系列

[ nb-shopping ]

12小時前, 06/20

66

230

[購機] 高中生想買30K中高階手機

12小時前, 06/20

34

114

Re: [請益] 9070xt hotspot過高？

[ PC_Shopping ]

14小時前, 06/20

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 ansi54 的文章

文章代碼(AID): #1MNf58G_ (Python)