[問題] 測試資料的特徵重要性

看板DataScience作者 (cshcsh6847)時間4年前 (2019/12/26 17:01), 編輯推噓2(208)
留言10則, 5人參與, 4年前最新討論串1/1
有一些問題想來問問版上的大大 拜託大家賜教了 在訓練ML的時候 用tree based模型可以看feature importance 知道模型基於哪些特徵來決定結果的 但是如果在跑測試資料的時候 想請問各位有沒有辦法顯示出為什麼分類結果是如此 E.g. 1/0 分類 A B C D feature是重要的 但是這筆資料主要是A的數值影響他被分類到1 請問各位有做過這類的事情嗎? 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.8.71.208 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1577350881.A.800.html

12/26 18:26, 4年前 , 1F
這是模型解釋的部分吧? 你可以從模型的最後面寫一支
12/26 18:26, 1F

12/26 18:26, 4年前 , 2F
輸出,然後把valid data跑過一遍
12/26 18:26, 2F

12/26 18:28, 4年前 , 3F
沒事,我誤會你的意思了
12/26 18:28, 3F

12/26 18:35, 4年前 , 4F
用Shap這個Python library 可以解決你的問題,他的做法
12/26 18:35, 4F

12/26 18:35, 4年前 , 5F
是基於game theory,只要你有模型,設定好測試基準,根
12/26 18:35, 5F

12/26 18:35, 4年前 , 6F
據你的測試集可以知道你的特徵選取原因。
12/26 18:35, 6F

12/27 00:32, 4年前 , 7F
sensitivity analysis?
12/27 00:32, 7F

12/27 01:51, 4年前 , 8F
很多時候不是單純因為一個特徵而被分類的吧
12/27 01:51, 8F

12/28 01:42, 4年前 , 9F
InterpretML: A Unified Framework for Machine Learn
12/28 01:42, 9F

12/28 01:46, 4年前 , 10F
ing Interpretability. 算新議題,看看吧
12/28 01:46, 10F
文章代碼(AID): #1U17RXW0 (DataScience)
文章代碼(AID): #1U17RXW0 (DataScience)