PTT數位生活區 / Python

[閒聊] 想跟 Web Scraping 高手請益自動化技術~

看板Python作者adwx1973 (adwx1973)時間7年前 (2018/09/21 11:31)推噓4(4推 0噓 7→)

留言11則, 5人參與討論串1/1

As title, 之前網路上看了些 Python 爬蟲基本教學，正試著從證交所爬蟲建立財報/股價資料庫。但沒多久就發現幾個問題： 1. 每天爬取公司股價，經常性斷線，加上 Header; time.sleep(); 之類的都用上了，想請益更有效率，穩定自動斷點續傳的技術。 2. 財報 PDF 想要自動化下載，因為隱藏網址似乎是 jsoncallback 產生的，並且網址當中一部分是隨機數 or 現在時刻(時分秒)，這方面沒辦法突破。也有試過 selenium + firefox webdriver，不過也是卡在多個頁面切換的操作無法 Loop。想請益版上這方面的高手，這些部分怎麼用 code 實現，如果人在高雄有時間也可以約出來，我可以請你吃飯~ 非常感謝!! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.236.32.144 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1537500697.A.DE8.html

推

09/21 12:58, 7年前 , 1^F

09/21 12:58, 1^F

推

09/21 15:54, 7年前 , 2^F

09/21 15:54, 2^F

推

09/23 23:28, 7年前 , 3^F

09/23 23:28, 3^F

推

09/25 04:56, 7年前 , 4^F

09/25 04:56, 4^F

→

09/25 04:56, 7年前 , 5^F

09/25 04:56, 5^F

→

09/25 04:57, 7年前 , 6^F

09/25 04:57, 6^F

→

09/25 04:57, 7年前 , 7^F

09/25 04:57, 7^F

→

09/25 10:59, 7年前 , 8^F

09/25 10:59, 8^F

→

09/25 11:00, 7年前 , 9^F

09/25 11:00, 9^F

→

09/25 11:03, 7年前 , 10^F

09/25 11:03, 10^F

→

09/25 11:04, 7年前 , 11^F

09/25 11:04, 11^F

‣ 返回看板[ Python ] 程設

‣ 更多 adwx1973 的文章

文章代碼(AID): #1Rf6OPte (Python)

Python 近期熱門文章

2

11

[問題] openpyxl到底能不能調整全局Font？

1月前, 05/07

7

21

[問題] super() 與MRO 鏈斷裂問題

3月前, 02/24

3

13

[問題] vscode的debug模式不用考慮中文路徑

4月前, 02/01

1

15

[問題] skimage.io.imread()讀圖檔底色是黃色？

5月前, 12/28

2

4

[閒聊] 有人要合購股票pythony資料庫finlab嗎?

5月前, 12/23

1

1

[問題] python 3.14 free thread build

7月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

7月前, 10/22

6

9

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

8月前, 10/09

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

8

15

[情報] 外媒詳測Windows 11的低延遲設定檔，指

[ PC_Shopping ]

4小時前, 06/16

14

33

[情報] 傳Intel將於2027推出Raptor Lake Next

[ PC_Shopping ]

9小時前, 06/16

5

6

[問題] 看影片時接通line，影片會繼續播放

11小時前, 06/15

6

17

[賣/北中/皆可] kingston KC3000 2TB

[ HardwareSale ]

11小時前, 06/15

4

6

[新聞] watchOS 27 震撼登場！智慧新功能全面升

11小時前, 06/15

7

37

[討論] 我這樣聽覺是正常的嗎?

12小時前, 06/15

8

18

[購機] 12K左右輕巧手機

12小時前, 06/15

3

8

[賣/台中/面交] 華碩TUF 5070TI顯卡已刪文

[ HardwareSale ]

13小時前, 06/15

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 adwx1973 的文章

文章代碼(AID): #1Rf6OPte (Python)