[問題] text mining 長詞優先

看板R_Language作者 (HTC ONE年不變)時間9年前 (2015/07/22 22:04), 編輯推噓0(003)
留言3則, 2人參與, 最新討論串1/2 (看更多)
[問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 入門(寫過其他程式,只是對語法不熟悉) [問題敘述]: 目前在作英文的文字探勘,已經可以分別算出單詞和雙詞的結果 舉例 : "Information management" 在文章中出現3次 "Information"在文章中出現5次 "management"在文章中出現6次 但因為想要長詞優先,所以"management"和"Information"的次數要分別減3次 http://imgur.com/jAjrZxK
以上為跑出的結果 不知道該如何達成這樣的作法 懇請前輩大大指導 [程式範例]: http://pastebin.com/27rXYuQp 程式碼 [環境敘述]: R version 3.1.2 (2014-10-31) Platform: x86_64-apple-darwin13.4.0 (64-bit) [關鍵字]: text mining 長詞優先 -- sent from my htc one年不變 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.254.151.162 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1437573894.A.A50.html

07/22 22:51, , 1F
我只想到用grep跟length做一個條件篩選,然後刪除,
07/22 22:51, 1F

07/22 22:51, , 2F
需要兩層迴圈來做,明天有空再來回程式碼
07/22 22:51, 2F

07/22 23:00, , 3F
感謝c大!!!
07/22 23:00, 3F
文章代碼(AID): #1LhwC6fG (R_Language)
討論串 (同標題文章)
文章代碼(AID): #1LhwC6fG (R_Language)