PTT數位生活區 / Python

[問題] 神秘金字塔爬蟲問題

看板Python作者kakar0to (Poker Face)時間6年前 (2019/10/26 13:54)推噓2(2推 0噓 2→)

留言4則, 3人參與討論串1/2 (看更多)

請問有人會爬神秘金字塔的網頁嗎? 例如下面這個頁面 https://norway.twsthr.info/StockHolders.aspx?stock=0050 我想把這些資訊爬出來 20191025 703,000 89,452 7.86 450,780 64.12 75 20 5 5 45 61.57 88.80 20191018 753,500 90,255 8.35 498,135 66.11 72 16 5 5 46 64.01 87.95 ... 我觀察網頁原始碼, 這些資訊大概在這兩種標籤的<td>裡面. <tr class='lDS'> 與 <tr class='lLS'> 不過我用beautifulSoup 去撈<tr class='lDS'>這個tag, 似乎也會撈到<tr class='lLS'>這個tag裡面的<td>的資訊 code如下, soup = BeautifulSoup(respStr,'html.parser') tr_list = soup.find_all('tr') for idx,tr in enumerate(tr_list): if tr.get('class') == ['lDS']: td_list = tr.find_all('td') for idx2,td in enumerate(td_list): print(td.text) 想問是不是有可能beautifulSoup有機會parse錯誤? 如果是的話有大大知道怎麼解決這個問題嗎? 或者給我個建議可以用什麼其他的方式把這些資訊爬出來? 感謝. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.72.97.13 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1572069268.A.785.html

推

10/26 15:02, 6年前 , 1^F

10/26 15:02, 1^F

→

10/26 15:23, 6年前 , 2^F

10/26 15:23, 2^F

※ 編輯: kakar0to (42.72.97.13 臺灣), 10/26/2019 15:23:50

→

10/26 15:24, 6年前 , 3^F

10/26 15:24, 3^F

推

10/29 12:04, 6年前 , 4^F

10/29 12:04, 4^F

‣ 返回看板[ Python ] 程設

‣ 更多 kakar0to 的文章

文章代碼(AID): #1Tiz-KU5 (Python)

討論串 (同標題文章)

完整討論串 (本文為第 1 之 2 篇)：

排序：最新先 | 最舊先 | 留言數

Re: [問題] 神秘金字塔爬蟲問題

6年前, 10/30

2

4

[問題] 神秘金字塔爬蟲問題

6年前, 10/26

在新視窗開啟完整討論串 (共2篇)

Python 近期熱門文章

2

12

[問題] 公司電腦無法透過python讀取usb攝像頭

2周前, 07/08

2

11

[問題] openpyxl到底能不能調整全局Font？

2月前, 05/07

7

21

[問題] super() 與MRO 鏈斷裂問題

5月前, 02/24

3

13

[問題] vscode的debug模式不用考慮中文路徑

5月前, 02/01

1

15

[問題] skimage.io.imread()讀圖檔底色是黃色？

7月前, 12/28

2

4

[閒聊] 有人要合購股票pythony資料庫finlab嗎?

7月前, 12/23

1

1

[問題] python 3.14 free thread build

9月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

9月前, 10/22

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

7

20

[問題] 太陽底下反光超嚴重

4小時前, 07/26

49

108

[情報] 不用等8月，對岸5070Ti 率先開漲到5080

[ PC_Shopping ]

7小時前, 07/26

0

9

[請益] 筆電cpu請益已刪文

[ PC_Shopping ]

7小時前, 07/26

19

56

[問題] 已下架手機入手方式請益

7小時前, 07/26

3

7

[問題] iPad 自費換電池

9小時前, 07/26

3

11

Re: [心得] 50系顯卡熱點溫度能看了

[ PC_Shopping ]

11小時前, 07/26

6

26

[討論] 三星折疊機預購放大券(三星商城適用)

15小時前, 07/26

84

292

[討論] 極客灣手機評測2 .0版

17小時前, 07/26

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 kakar0to 的文章

文章代碼(AID): #1Tiz-KU5 (Python)