[問題] 將文章以字為單位進行切分
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
我想用R計算文本的字頻。
大多數的中文文本處理好像都會包含斷詞,
所以都是斷詞後計算詞頻。
有沒有可以直接取得字頻資訊的函數或套件?
或將文本先將字一個一個斷開的函數?
--
觀自在菩薩。行深般若波羅蜜多時。照見五蘊皆空。度一切苦厄。舍利子。色不異空。空
不異色。色即是空。空即是色。受想行識。亦復如是。舍利子。是諸法空相。不生不滅。
不垢不淨。不增不減。是故空中無色。無受想行識。無眼耳鼻舌身意。無色聲香味觸法。
無眼界乃至無意識界。無無明。亦無無明盡。乃至無老死。亦無老死盡。無苦集滅道。無
智亦無得。已無所得故。菩提薩埵。依般若波羅蜜多故。心無罣礙。無罣礙故。無有恐怖
。遠離顛倒夢想。究竟涅槃。三世諸佛。依般若波羅蜜多故。得阿耨多羅三藐三菩提。故
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.232.38.93
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1537062636.A.C45.html
推
09/16 10:59,
6年前
, 1F
09/16 10:59, 1F
→
09/16 11:28,
6年前
, 2F
09/16 11:28, 2F
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章