PTT數位生活區 / R_Language

[問題] text mining 長詞優先

看板R_Language作者john5601 (HTC ONE年不變)時間11年前 (2015/07/22 22:04)推噓0(0推 0噓 3→)

留言3則, 2人參與討論串1/2 (看更多)

[問題類型]: 程式諮詢(我想用R 做某件事情，但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 入門(寫過其他程式，只是對語法不熟悉) [問題敘述]: 目前在作英文的文字探勘，已經可以分別算出單詞和雙詞的結果舉例 : "Information management" 在文章中出現3次 "Information"在文章中出現5次 "management"在文章中出現6次但因為想要長詞優先，所以"management"和"Information"的次數要分別減3次 http://imgur.com/jAjrZxK

以上為跑出的結果不知道該如何達成這樣的作法懇請前輩大大指導 [程式範例]: http://pastebin.com/27rXYuQp 程式碼 [環境敘述]: R version 3.1.2 (2014-10-31) Platform: x86_64-apple-darwin13.4.0 (64-bit) [關鍵字]: text mining 長詞優先 -- sent from my htc one年不變 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.254.151.162 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1437573894.A.A50.html

→

07/22 22:51, , 1^F

07/22 22:51, 1^F

→

07/22 22:51, , 2^F

07/22 22:51, 2^F

→

07/22 23:00, , 3^F

07/22 23:00, 3^F

‣ 返回看板[ R_Language ] 程式

‣ 更多 john5601 的文章

文章代碼(AID): #1LhwC6fG (R_Language)

討論串 (同標題文章)

以下文章回應了本文：

2

4

Re: [問題] text mining 長詞優先

11年前, 07/23

完整討論串 (本文為第 1 之 2 篇)：

排序：最新先 | 最舊先 | 留言數

2

4

Re: [問題] text mining 長詞優先

11年前, 07/23

0

3

[問題] text mining 長詞優先

11年前, 07/22

在新視窗開啟完整討論串 (共2篇)

R_Language 近期熱門文章

2

2

Re: [問題] geombar分類對齊函數

1年前, 04/24

2

2

[問題] geombar分類對齊函數

1年前, 04/21

1

2

徵求R studio家教

1年前, 01/17

1

7

[問題] 請問如何多次複製1筆資料? (求救)

1年前, 11/10

4

6

[問題] 如何將資料重組 (觀察值轉成變數)？

1年前, 10/28

2

8

[問題] 可否以RODBC去連Oracle??

1年前, 08/21

1

3

[問題] augPred function 出現錯誤訊息?

2年前, 07/27

2

8

[問題] IRT相關問題

2年前, 05/01

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

3

7

[開箱] 藍寶9070GRE五年保雙風扇1440P遊戲CP首選

[ PC_Shopping ]

1小時前, 07/29

4

6

Re: [情報] 三星Z Fold8公布售價預購活動

1小時前, 07/29

3

28

[菜單] 20k AM4平台升級孝親機

[ PC_Shopping ]

2小時前, 07/29

11

25

[情報] AMAZON US 顯卡還沒漲啟動即視感

[ PC_Shopping ]

4小時前, 07/29

46

68

[情報] 三星Z Fold8公布售價預購活動

5小時前, 07/29

98

158

[情報] 指標金士頓D5 大漲價16x2 均價15000

[ PC_Shopping ]

6小時前, 07/29

6

14

[購機] 購機選擇

6小時前, 07/29

35

122

[請益] 顯卡廠商rma會有開箱錄影嗎？

[ PC_Shopping ]

7小時前, 07/29

更多即時熱門文章 >>

‣ 返回看板[ R_Language ] 程式

‣ 更多 john5601 的文章

文章代碼(AID): #1LhwC6fG (R_Language)