[問題] 怎麼確保資料分布跟真實世界相近 ?
最近進行一些電腦視覺的專案,
發現實在很難確認收集來的資料(圖片)到底夠不夠貼近真實世界的狀況。
舉例來說,我用一個開放資料集,以這個資料集為基礎上可以取得相當不錯的訓練成果,
但發現在真實世界的推論卻達不到標準。
回過頭來看,如果要加資料,也不知道可以怎麼加,
要加上哪種資料才可以讓模型更 robust
想請教大家,在收集資料上面,都是怎麼確保資料的品質 ?
不管是圖像資料或是量化資料,
要用什麼方式或從什麼面向來確定自己的資料本身是沒問題的呢 ?
--
◤ ◤ ◣
● Ο ο ◤ ◣ ◣
◣ ◤ 。 ο ○ 。 ○ °●
◣ ≡ ◤ ° ο Ο ◣ ◤
◤ ◣ ≡ ◤
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.115.192.106 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1590545693.A.2A0.html
推
05/27 15:29,
4年前
, 1F
05/27 15:29, 1F
推
05/27 17:52,
4年前
, 2F
05/27 17:52, 2F
→
05/27 17:53,
4年前
, 3F
05/27 17:53, 3F
→
05/27 17:54,
4年前
, 4F
05/27 17:54, 4F
→
05/27 17:55,
4年前
, 5F
05/27 17:55, 5F
→
05/27 17:55,
4年前
, 6F
05/27 17:55, 6F
推
05/30 16:53,
4年前
, 7F
05/30 16:53, 7F
→
05/30 16:53,
4年前
, 8F
05/30 16:53, 8F
→
06/07 04:11,
4年前
, 9F
06/07 04:11, 9F
推
06/07 19:07,
4年前
, 10F
06/07 19:07, 10F
推
06/10 12:27,
4年前
, 11F
06/10 12:27, 11F
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章