[問題]10-fold validation的資料集非10的倍數

看板DataScience作者 (fz77)時間1年前 (2023/01/11 03:36), 編輯推噓3(306)
留言9則, 5人參與, 1年前最新討論串1/1
請問各位前輩,若我有一個資料集要進行多分類(如:每類79張圖片共116類),共有9164張 圖片,但9164不是10的倍數,是否就無法進行10-fold cross validation了呢? 因按照定義,應該要切出9/10進行訓練,1/10進行測試,但該資料集是無法被10除盡的, 實務上應該如何進行呢? 感謝各位! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 150.117.153.60 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1673379368.A.46B.html

01/11 07:00, 1年前 , 1F
認真問?反串?洗文章?どっち
01/11 07:00, 1F

01/11 09:57, 1年前 , 2F
下一篇 data size是64*64*3 input neurons是 32*3
01/11 09:57, 2F

01/11 09:57, 1年前 , 3F
2*3 是不是就不能做了呢
01/11 09:57, 3F

01/11 17:17, 1年前 , 4F
如果有10個糖果要分給3個人要怎麼辦
01/11 17:17, 4F

01/11 17:17, 1年前 , 5F
10不能被3整除是不是就不能分給3個人了呢
01/11 17:17, 5F

01/12 22:44, 1年前 , 6F
某類多幾張少幾張不是問題,class weight修正一下
01/12 22:44, 6F

01/13 12:27, 1年前 , 7F
我做的時候是讓他數量盡量平均,stratification 有做就好
01/13 12:27, 7F

01/13 12:27, 1年前 , 8F
的話出來結果也不會差多少
01/13 12:27, 8F

01/13 16:43, 1年前 , 9F
髒的樣本去掉還比較重要
01/13 16:43, 9F
文章代碼(AID): #1ZlRueHh (DataScience)
文章代碼(AID): #1ZlRueHh (DataScience)