[問題] batch size過大時,為什麼容易overfittin
如題
為什麼batch size過大時即使沒有卡在saddle point
仍比小batch size容易overfitting?
有沒有科學的解釋?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.140.75.126
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1535513919.A.2C6.html
推
08/29 13:02,
6年前
, 1F
08/29 13:02, 1F
→
08/29 13:02,
6年前
, 2F
08/29 13:02, 2F
→
08/29 13:39,
6年前
, 3F
08/29 13:39, 3F
→
08/29 13:39,
6年前
, 4F
08/29 13:39, 4F
→
08/29 15:41,
6年前
, 5F
08/29 15:41, 5F
推
08/29 15:43,
6年前
, 6F
08/29 15:43, 6F
推
08/29 16:36,
6年前
, 7F
08/29 16:36, 7F
→
08/29 16:36,
6年前
, 8F
08/29 16:36, 8F
→
08/29 16:36,
6年前
, 9F
08/29 16:36, 9F
推
08/29 16:40,
6年前
, 10F
08/29 16:40, 10F
→
08/29 16:40,
6年前
, 11F
08/29 16:40, 11F
→
08/29 16:40,
6年前
, 12F
08/29 16:40, 12F
推
08/29 16:48,
6年前
, 13F
08/29 16:48, 13F
→
08/29 16:48,
6年前
, 14F
08/29 16:48, 14F
推
08/29 16:59,
6年前
, 15F
08/29 16:59, 15F
→
08/29 16:59,
6年前
, 16F
08/29 16:59, 16F
推
08/29 18:55,
6年前
, 17F
08/29 18:55, 17F
→
08/30 03:02,
6年前
, 18F
08/30 03:02, 18F
→
08/30 14:15,
6年前
, 19F
08/30 14:15, 19F
→
08/30 19:02,
6年前
, 20F
08/30 19:02, 20F
→
08/31 13:03,
6年前
, 21F
08/31 13:03, 21F
推
08/31 21:56,
6年前
, 22F
08/31 21:56, 22F
討論串 (同標題文章)
完整討論串 (本文為第 1 之 3 篇):
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章
0
18