[問題] R程式 文字處理(同義字轉換)
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
目前我有一份文字檔在Corpus中
> inspect(new_data)
<<VCorpus (documents: 1, metadata (corpus/indexed): 0/0)>>
[[1]]
<<PlainTextDocument (metadata: 7)>>
still call happening
since first downloaded ios 8 now
(上面文件內容是經過stripWhitespace、removePunctuation等步驟而已)
然後我想自己定義一個
出現(happening,issue,occurence)歸類為 happen
出現(ios 8,ios 802, ios 8.0.2)歸類為 ios8
因此當
happening 會轉換成 happen
ios 8 (中間含有空白) 會轉換成 ios8
我試過wordnet package Synonyms,
但是我只會查詢同義字,不會抓出來轉換,
而且我比較傾向自己定義同義字。
想很久都不知道該如何寫?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.224.46.112
※ 文章網址: http://www.ptt.cc/bbs/R_Language/M.1413692365.A.31D.html
※ 編輯: sinkome (36.224.46.112), 10/19/2014 12:20:02
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 2 篇):
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章
-1
12