PTT數位生活區 / DataScience

[問題] Imbalanced dataset使用SOMTE求教

看板DataScience作者boggy時間3年前 (2022/05/06 22:41)推噓5(5推 0噓 14→)

留言19則, 7人參與討論串1/1

大家好我正在做一個關於imbalanced data的分析正樣本大概1%，feature有95個，data共6500筆左右簡單的特徵處理後對X_train 我先用sklearn的SMOTENC來合成正樣本(因為feature含nominal variable故用SMOTENC) 之後先簡單用logistic regression來fit X_test 結果居然發現使用SMOTENC後ROCAUC/PRAUC/F1那些的居然都變差了...... 這根本顛覆我的認知了啊@@" 可是查了程式碼和網路上爬了一堆文也還不知道是為什麼? (後來再try其他模型也都是一樣結果) 想請問各位這種結果是有可能的嗎? 已經想了一整天了QQ 感謝大家看完~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.234.122.138 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1651848080.A.D27.html

→

05/07 01:38, 3年前 , 1^F

05/07 01:38, 1^F

推

05/07 04:21, 3年前 , 2^F

05/07 04:21, 2^F

推

05/07 06:39, 3年前 , 3^F

05/07 06:39, 3^F

→

05/07 06:39, 3年前 , 4^F

05/07 06:39, 4^F

推

05/07 06:56, 3年前 , 5^F

05/07 06:56, 5^F

→

05/07 06:56, 3年前 , 6^F

05/07 06:56, 6^F

→

05/07 06:56, 3年前 , 7^F

05/07 06:56, 7^F

推

05/07 13:09, 3年前 , 8^F

05/07 13:09, 8^F

→

05/07 13:09, 3年前 , 9^F

05/07 13:09, 9^F

→

05/07 13:09, 3年前 , 10^F

05/07 13:09, 10^F

→

05/07 13:09, 3年前 , 11^F

05/07 13:09, 11^F

→

05/07 13:48, 3年前 , 12^F

05/07 13:48, 12^F

→

05/08 00:09, 3年前 , 13^F

05/08 00:09, 13^F

→

05/08 00:09, 3年前 , 14^F

05/08 00:09, 14^F

→

05/08 00:10, 3年前 , 15^F

05/08 00:10, 15^F

→

05/08 00:11, 3年前 , 16^F

05/08 00:11, 16^F

推

05/10 00:02, 3年前 , 17^F

05/10 00:02, 17^F

→

05/10 00:04, 3年前 , 18^F

05/10 00:04, 18^F

→

05/10 00:04, 3年前 , 19^F

05/10 00:04, 19^F

‣ 返回看板[ DataScience ] 研討

‣ 更多 boggy 的文章

文章代碼(AID): #1YTJEGqd (DataScience)

DataScience 近期熱門文章

2

6

[問題] 文字探勘的特徵選取問題

[ DataScience ]

1月前, 07/01

1

9

[問題] 請問kaggle有商業方案嗎? 它每週gpu的限

[ DataScience ]

5月前, 02/26

4

4

[徵才] 美國Amazon暑期實習生

[ DataScience ]

6月前, 01/23

1

6

[問題] 請教大家有推薦的GPU租用服務嗎?

[ DataScience ]

7月前, 12/20

3

8

[討論] 如何計算兩個不同欄的相似度？

[ DataScience ]

10月前, 09/07

1

4

Re: [問題] 如何在python中訓練好autoencoder?已刪文

[ DataScience ]

11月前, 08/06

2

12

[討論] 有人開始用KAN了嗎？

[ DataScience ]

1年前, 08/04

4

13

Re: [討論] cognitive model/causal ML執行的細節

[ DataScience ]

1年前, 05/15

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

6

20

[情報] Amazon 7800X3D、9950X3D史低

[ PC_Shopping ]

47分鐘前, 07/31

0

14

[菜單] 45k 影音遊戲機

[ PC_Shopping ]

1小時前, 07/31

6

11

Re: [新聞] iPhone 17全系列模型照流出　四款新機型i

1小時前, 07/31

3

9

[情報] 時價屋 AMD Threadripper 9000X 報價

[ PC_Shopping ]

1小時前, 07/31

5

23

[請益] 6年電腦升級

[ PC_Shopping ]

3小時前, 07/31

1

10

[菜單] 61k 遊戲機

[ PC_Shopping ]

5小時前, 07/31

11

35

[請益] 可以上下擺的雙螢幕支架

[ PC_Shopping ]

5小時前, 07/31

10

36

[問題] S24 Ultra 該在哪買(附上價格)

6小時前, 07/31

更多即時熱門文章 >>

‣ 返回看板[ DataScience ] 研討

‣ 更多 boggy 的文章

文章代碼(AID): #1YTJEGqd (DataScience)