[問題] 特徵與標籤的相關性拿來做特徵工程?已刪文
作業系統:win10
問題類別:ML,DL,NN,DS
使用工具:python,tensorflow,keras
問題內容:
大家好,
小弟是碩士研究生,
最近在做深度學習專題。
我將原始資料做minmax scaler後,
餵給神經網路,發現準確率不高。
我突發奇想,
把特徵(features)和標籤(label)的相關係數求出來,
如果是正相關,
就維持特徵原本的值,
反之,若是負相關,
就將特徵值乘上-1。
做完上述轉換後再做minmax scaler,
丟進神經網路後,
發現平均準確率上升不少
(用5折交叉驗證法)
原本開心的要收工了
凌晨突然想到:
我這樣算不算偷看答案啊?
監督式機器學習的資料前處理
是可以這樣做的嗎?
還是有其他「合法」的做法可以參考呢?
先謝謝各位點進來的大大
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.47.162 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1596831241.A.137.html
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章