[問題] 分類問題 欄位中有文字的處理方式
小弟新手發問如有文字上描述疏失請見諒,會再更改
如題,一個作業要預測男女的分類問題。
欄位中有一欄為文字的自我介紹,
目前在上網查找的文章中,文本分類基本上就是只針對文字內容進行處理跟預測,找不到
分類問題中欄位內有文字跟沒文字都有的教學,
因此想請教幾個作法是否正確:
1.目前文字的特徵是用tfidf算完,請問算完的欄位要合併到原本的資料集一起訓練
2.tfidf欄位跟原有的欄位分開訓練,文字欄位先訓練完將預測結果放入原有資料集的欄
位,再進行訓練
3.是否有較正統、常規的作法
或是提供關鍵字讓小弟可以上網再找看看 謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.72.137.88 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1585666942.A.F42.html
→
04/01 10:10,
4年前
, 1F
04/01 10:10, 1F
→
04/01 10:10,
4年前
, 2F
04/01 10:10, 2F
→
04/01 10:10,
4年前
, 3F
04/01 10:10, 3F
→
04/01 10:10,
4年前
, 4F
04/01 10:10, 4F
→
04/01 10:10,
4年前
, 5F
04/01 10:10, 5F
→
04/01 23:34,
4年前
, 6F
04/01 23:34, 6F
推
04/02 03:35,
4年前
, 7F
04/02 03:35, 7F
→
04/02 03:36,
4年前
, 8F
04/02 03:36, 8F
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章