[問題] neural net MT 的 Validation set 到底在做什麼?
請問一下各位高手 關於Validation set 跟 Training set的差別
特別是validation set 的功用是什麼?
(這裡的validation set 不是 test data的意思 雖然文獻上這兩個詞也滿常交互使用)
要訓練一個Neural net model, 需要兩組數據, Training set 跟 Validation set.
兩組數據都是*已知數據*, 模組就從這裡學. 我的問題是 為什麼特別區分成兩組呢?
還有印象中黃金比例是 2:1 (train:val)
我自己模模糊糊的理解是 training set 教會大部分的parameter,
再用validation set來微調.
這樣的理解是對的嗎?
如果對的的話 那些parameter是只有在validation 才能調 training set調不了的呢?
這是合理的問題嗎?
(小弟我只懂的大方向 跟怎麼用 很多基本的原理還是學的不扎實...慢慢補強...)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 68.230.60.98
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1521691079.A.014.html
※ 編輯: lucien0410 (68.230.60.98), 03/22/2018 11:59:20
推
03/22 12:46,
6年前
, 1F
03/22 12:46, 1F
→
03/22 12:46,
6年前
, 2F
03/22 12:46, 2F
→
03/22 12:46,
6年前
, 3F
03/22 12:46, 3F
→
03/22 12:46,
6年前
, 4F
03/22 12:46, 4F
→
03/22 12:46,
6年前
, 5F
03/22 12:46, 5F
→
03/22 12:46,
6年前
, 6F
03/22 12:46, 6F
→
03/22 12:46,
6年前
, 7F
03/22 12:46, 7F
→
03/22 12:58,
6年前
, 8F
03/22 12:58, 8F
→
03/22 12:59,
6年前
, 9F
03/22 12:59, 9F
推
03/22 13:02,
6年前
, 10F
03/22 13:02, 10F
我回去查了文獻 (我做的是機器翻譯) 有這段話
(https://arxiv.org/abs/1709.07809 page 18)
"A common stopping criteria is to check progress of the model on a validation
set (that is not part of the training data) and halt when the error on the
validation set does not improve. Training longer would not lead to any
further improvements and may even degrade performance due to overfitting.
"
這跟siscon大說的相符 (一開始手殘i打成u)
我用的軟體是OpenNMT 這個軟體要求 val set 又自動停在 epoch 13
這樣說的話 是不是OpenNMT搞錯了 validation set 功用呢?
(OpenNMT 有個論壇 我可以去抱怨一下)
※ 編輯: lucien0410 (68.230.60.98), 03/22/2018 13:18:20
※ 編輯: lucien0410 (68.230.60.98), 03/22/2018 13:34:13
→
03/22 13:49,
6年前
, 11F
03/22 13:49, 11F
→
03/22 13:51,
6年前
, 12F
03/22 13:51, 12F
→
03/22 13:52,
6年前
, 13F
03/22 13:52, 13F
→
03/22 13:53,
6年前
, 14F
03/22 13:53, 14F
→
03/22 13:55,
6年前
, 15F
03/22 13:55, 15F
→
03/22 13:56,
6年前
, 16F
03/22 13:56, 16F
推
03/22 14:56,
6年前
, 17F
03/22 14:56, 17F
→
03/22 14:57,
6年前
, 18F
03/22 14:57, 18F
推
03/22 15:19,
6年前
, 19F
03/22 15:19, 19F
推
03/22 17:43,
6年前
, 20F
03/22 17:43, 20F
推
03/22 20:42,
6年前
, 21F
03/22 20:42, 21F
→
03/22 20:42,
6年前
, 22F
03/22 20:42, 22F
→
03/22 20:42,
6年前
, 23F
03/22 20:42, 23F
→
03/22 20:42,
6年前
, 24F
03/22 20:42, 24F
推
03/22 20:46,
6年前
, 25F
03/22 20:46, 25F
→
03/22 20:46,
6年前
, 26F
03/22 20:46, 26F
推
03/22 20:46,
6年前
, 27F
03/22 20:46, 27F
推
03/22 20:57,
6年前
, 28F
03/22 20:57, 28F
→
03/22 20:58,
6年前
, 29F
03/22 20:58, 29F
推
03/22 21:03,
6年前
, 30F
03/22 21:03, 30F
→
03/22 21:04,
6年前
, 31F
03/22 21:04, 31F
推
03/22 21:07,
6年前
, 32F
03/22 21:07, 32F
→
03/22 21:32,
6年前
, 33F
03/22 21:32, 33F
→
03/22 21:33,
6年前
, 34F
03/22 21:33, 34F
→
03/22 21:33,
6年前
, 35F
03/22 21:33, 35F
→
03/22 21:36,
6年前
, 36F
03/22 21:36, 36F
→
03/22 21:36,
6年前
, 37F
03/22 21:36, 37F
→
03/22 21:38,
6年前
, 38F
03/22 21:38, 38F
→
03/22 21:38,
6年前
, 39F
03/22 21:38, 39F
→
03/22 23:50,
6年前
, 40F
03/22 23:50, 40F
→
03/22 23:50,
6年前
, 41F
03/22 23:50, 41F
→
03/22 23:50,
6年前
, 42F
03/22 23:50, 42F
推
03/23 01:04,
6年前
, 43F
03/23 01:04, 43F
→
03/23 01:05,
6年前
, 44F
03/23 01:05, 44F
推
03/23 01:07,
6年前
, 45F
03/23 01:07, 45F
推
03/23 01:10,
6年前
, 46F
03/23 01:10, 46F
→
03/23 01:10,
6年前
, 47F
03/23 01:10, 47F
→
03/23 01:10,
6年前
, 48F
03/23 01:10, 48F
goldflower大 多謝啦
但問一問基本的問題也不錯吧 讓有興趣的但還在學的人也來討論討論
像是教學的blog的性質 這樣的datascience版 也不錯吧
正如你說的 嚴格來說 OpenNMT沒有拿 val set 來調參數
而是拿來評估 overfitting 和 convergence
但這又讓我覺得奇怪了 這樣的話 epoch的數量 應該是自動設定的
converged後 自動停止才對
但OpenNMT的epoch 又是手動設定的 hyperparameter (預設值是13)
另外 結果這個問題 真的有人在論壇上問過:
http://forum.opennmt.net/t/validation-data/128
那些OpenNMT的developers 也真的自己出來回答 滿有意思的
Guillaume Klein說實際上來說 val set 可以來讓做為挑選那個epoch的標準
就挑 validation perplexity 最低的那個
※ 編輯: lucien0410 (68.230.60.98), 03/23/2018 01:32:23
→
03/23 01:12,
6年前
, 49F
03/23 01:12, 49F
推
03/23 01:42,
6年前
, 50F
03/23 01:42, 50F
→
03/23 01:43,
6年前
, 51F
03/23 01:43, 51F
推
03/23 01:48,
6年前
, 52F
03/23 01:48, 52F
→
03/23 01:48,
6年前
, 53F
03/23 01:48, 53F
推
03/23 02:37,
6年前
, 54F
03/23 02:37, 54F
→
03/23 02:37,
6年前
, 55F
03/23 02:37, 55F
→
03/23 03:37,
6年前
, 56F
03/23 03:37, 56F
→
03/23 03:37,
6年前
, 57F
03/23 03:37, 57F
推
03/26 00:14,
6年前
, 58F
03/26 00:14, 58F
推
04/05 10:43,
6年前
, 59F
04/05 10:43, 59F
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章