討論串[問題] NLP英文文章處理
共 2 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者piercelin (pierce)時間7年前 (2018/03/10 22:38), 編輯資訊
1
0
0
內容預覽:
[問題敘述]:. 大家好,最近在練習用R跑NLP,目前處理英文文章,在斷詞方面我想使用自己的. 詞庫進行斷詞,例如文章中"My name is Pierce",正常斷詞會斷在空格處變成"My" "name""is" "Pierce",但我想使用自己的詞庫讓斷詞變成:"My name" "is" "P
(還有246個字)

推噓2(2推 0噓 3→)留言5則,0人參與, 7年前最新作者Darlsa (WSP)時間7年前 (2018/03/14 21:25), 編輯資訊
0
0
0
內容預覽:
嗨,我之前處理tm的時候,也有遇到同樣的問題,. 我要抓雙字詞的出現頻率,但tm包都會直接分成兩個字,. 例如「social design」會被分成「social」跟「design」,. 我的做法是直接把兩個字的空格去掉,黏在一起,然後用gsub()把原文替換成黏起來的,這樣tm包在處理的時候,就會
首頁
上一頁
1
下一頁
尾頁