PTT數位生活區 / DataScience

[問題] 文字探勘的特徵選取問題

看板DataScience作者iambakr (123)時間1年前 (2025/07/01 00:23)推噓2(2推 0噓 4→)

留言6則, 3人參與討論串1/1

作業系統:(ex:mac,win10,win8,win7,linux,etc...) win10 問題類別:(ex：ML,SVM,RL,DL,RNN,CNN,NLP,BD,Vis,etc...) ML 使用工具:(ex:python,Java,C++,tensorflow,keras,MATLAB,etc...) R 問題內容: 我打算使用 TF-IDF 作文字探勘，碰到以下幾個問題: Q1:我打算用 mutual information 與 mRMR作特徵選取我應該先做 TF-IDF 然後再做特徵選取? 還是反過來? Q2: 承上，我將降維後的詞彙作機器學習分類 (ex: svm, rf, etc) 我需要將這些文字特徵以及其他數值型特徵作標準化嗎? 如下面 code 最後一行以及倒數第二行有註解的 step_nzv() 這個實務上也是需要的嗎? rec <- recipe(Label ~ ., data = train_data) |> step_zv(all_predictors()) |> #step_nzv(all_predictors()) |> step_normalize(all_numeric_predictors()) 謝謝各位 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.37.214.84 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1751300589.A.FD5.html

→

07/01 02:26, 1年前 , 1^F

07/01 02:26, 1^F

→

07/01 02:26, 1年前 , 2^F

07/01 02:26, 2^F

推

07/04 14:59, 1年前 , 3^F

07/04 14:59, 3^F

推

07/05 18:54, 1年前 , 4^F

07/05 18:54, 4^F

→

07/10 08:29, 1年前 , 5^F

07/10 08:29, 5^F

→

07/10 08:29, 1年前 , 6^F

07/10 08:29, 6^F

‣ 返回看板[ DataScience ] 研討

‣ 更多 iambakr 的文章

文章代碼(AID): #1eOhdj_L (DataScience)

DataScience 近期熱門文章

3

17

[討論] 請問有真正把AI運用到工作、投資、或賺

[ DataScience ]

7月前, 11/26

6

17

[討論] 各位會買相關書籍來看嗎?

[ DataScience ]

8月前, 10/31

3

10

[問題] 請問想看CV相關討論適合去何處

[ DataScience ]

9月前, 10/17

2

6

[問題] 文字探勘的特徵選取問題

[ DataScience ]

1年前, 07/01

1

9

[問題] 請問kaggle有商業方案嗎? 它每週gpu的限

[ DataScience ]

1年前, 02/26

4

4

[徵才] 美國Amazon暑期實習生

[ DataScience ]

1年前, 01/23

1

6

[問題] 請教大家有推薦的GPU租用服務嗎?

[ DataScience ]

1年前, 12/20

3

8

[討論] 如何計算兩個不同欄的相似度？

[ DataScience ]

1年前, 09/07

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

8

19

[情報] 原價屋X3D背插海景套裝機

[ PC_Shopping ]

2小時前, 07/17

1

6

[徵/林口/皆可] Dual 4070 4T SSD

[ HardwareSale ]

7小時前, 07/17

10

118

[請益] 約140K的ITX菜單求指點

[ PC_Shopping ]

11小時前, 07/16

9

23

[情報] 7700X3D出了，不過價格....

[ PC_Shopping ]

11小時前, 07/16

-2

20

[請益] Illustrator 跟 Photoshop版本

[ PC_Shopping ]

11小時前, 07/16

3

10

[問題] wifi通話選項

11小時前, 07/16

7

25

[問題] VIVO 跟小米的系統問題

12小時前, 07/16

3

11

Re: [請益] 推薦不會卡第一條pcie的雙塔散熱器

[ PC_Shopping ]

12小時前, 07/16

更多即時熱門文章 >>

‣ 返回看板[ DataScience ] 研討

‣ 更多 iambakr 的文章

文章代碼(AID): #1eOhdj_L (DataScience)