[問題] 中文資料集分類
小弟初探資料科學
將中文信件資料集分類為兩類B、C(依信件內容機密度)
若是已經將內容用jieba切好了
也使用TfidfTransform計算出每封e-mail的TF-IDF值
想請問接下來該怎麼繼續操作
SVM k-means
可以請大大推薦可以讓我學習的文章或youtube教學嗎
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.120.67.6
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1535422939.A.617.html
→
08/28 18:11,
6年前
, 1F
08/28 18:11, 1F
推
08/29 15:31,
6年前
, 2F
08/29 15:31, 2F
→
08/29 15:33,
6年前
, 3F
08/29 15:33, 3F
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章
0
18