PTT數位生活區 / Python

[問題] 大量資料groupby 速率問題

看板Python作者qwtl0213 (Wezzy)時間2年前 (2023/05/28 23:16)推噓4(4推 0噓 10→)

留言14則, 5人參與討論串1/1

大家好，小弟目前在處理大量資料時遇到了一些問題我有一個dataset 大概有20000筆資料，而因為要用grid search 去找最佳參數，所以我目前的做法是先把原始資料集複製N次（N大概會抓到記憶體能負擔得程度）然後再利用numba 向量化的方式去進行向量化運算而我想做的是把N組算出來的目標函數，依照每組參數進行相加（依照iteration 的編號相加，目前想得出來的只有pandas 的 groupby 方法比較適合我）但是用groupby 的話就會要花費時間把大型array 轉換成dataframe 在進行相加，這樣速度就會慢很多想請問各位有沒有什麼比較好的處理方法，感謝不盡！ ---- Sent from BePTT -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.200.245.137 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1685286971.A.85B.html

→

05/28 23:53, 2年前 , 1^F

05/28 23:53, 1^F

推

05/29 11:17, 2年前 , 2^F

05/29 11:17, 2^F

推

06/04 11:37, , 3^F

06/04 11:37, 3^F

→

06/04 11:38, , 4^F

06/04 11:38, 4^F

→

06/04 11:39, , 5^F

06/04 11:39, 5^F

→

06/04 11:40, , 6^F

06/04 11:40, 6^F

→

06/04 11:40, , 7^F

06/04 11:40, 7^F

→

06/04 14:57, , 8^F

06/04 14:57, 8^F

→

06/04 14:57, , 9^F

06/04 14:57, 9^F

→

06/04 14:57, , 10^F

06/04 14:57, 10^F

推

06/04 17:24, , 11^F

06/04 17:24, 11^F

→

06/04 17:24, , 12^F

06/04 17:24, 12^F

推

06/17 14:48, , 13^F

06/17 14:48, 13^F

→

06/17 14:48, , 14^F

06/17 14:48, 14^F

‣ 返回看板[ Python ] 程設

‣ 更多 qwtl0213 的文章

文章代碼(AID): #1aSt0xXR (Python)

Python 近期熱門文章

4

7

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

5天前, 10/09

4

21

[閒聊] Python 3.13 版本是不是很爛啊！？

2月前, 07/19

11

19

[閒聊] 各位現在用os.path 還是用pathlib.Path

2月前, 07/17

5

10

[閒聊] 2024年的自我python學習

3月前, 07/17

1

2

[問題] 用Whisper AI幫我下載字幕（有酬）

6月前, 04/01

1

3

[問題] selenium 有辦法做檔案上傳嗎?

8月前, 02/03

3

13

Fw: [討論] 哈囉請問有給python新手的課程嗎

8月前, 01/24

4

19

Re: [問題] @property 真正的運用是啥

9月前, 01/15

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

5

18

[請益] 1070ti 想升級 5060

[ PC_Shopping ]

2小時前, 10/15

7

15

[問題] 別人的電信費帳單寄到我家

2小時前, 10/15

14

22

[討論] 國外網友iPhone 17橘色曬太陽產生色變

3小時前, 10/15

0

6

[購機] 小朋友玩遊戲手機

3小時前, 10/15

4

20

[討論] GRAM的續航力？尋找輕薄高續航筆電

[ nb-shopping ]

5小時前, 10/15

11

42

[問題] 哪裡買保護貼的膠？

6小時前, 10/15

4

7

[問題] Android 近期跳出朋友生日通知

6小時前, 10/15

-3

13

[討論] Pixel 10 Pro Fold 冒煙@JerryRigEveryth

9小時前, 10/15

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 qwtl0213 的文章

文章代碼(AID): #1aSt0xXR (Python)