[問題] text mining 長詞優先
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
目前在作英文的文字探勘,已經可以分別算出單詞和雙詞的結果
舉例 :
"Information management" 在文章中出現3次
"Information"在文章中出現5次
"management"在文章中出現6次
但因為想要長詞優先,所以"management"和"Information"的次數要分別減3次
http://imgur.com/jAjrZxK
以上為跑出的結果 不知道該如何達成這樣的作法
懇請前輩大大指導
[程式範例]:
http://pastebin.com/27rXYuQp 程式碼
[環境敘述]:
R version 3.1.2 (2014-10-31)
Platform: x86_64-apple-darwin13.4.0 (64-bit)
[關鍵字]:
text mining
長詞優先
--
sent from my htc one年不變
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.254.151.162
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1437573894.A.A50.html
→
07/22 22:51, , 1F
07/22 22:51, 1F
→
07/22 22:51, , 2F
07/22 22:51, 2F
→
07/22 23:00, , 3F
07/22 23:00, 3F
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 2 篇):
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章