PTT
數位生活區
即時熱門文章
24小時內熱門文章
最新文章
熱門看板
看板列表
我的收藏
最近瀏覽
批踢踢 PTT 搜尋引擎
看板
[
R_Language
]
討論串
[問題] NLP英文文章處理
共 2 篇文章
排序:
最舊先
|
最新先
|
留言數
|
推文總分
內容預覽:
開啟
|
關閉
|
只限未讀
首頁
上一頁
1
下一頁
尾頁
#1
[問題] NLP英文文章處理
推噓
0
(0推
0噓 0→
)
留言
0則,0人
參與
,
最新
作者
piercelin
(pierce)
時間
7年前
發表
(2018/03/10 22:38)
,
編輯
資訊
1篇文章回應此文
1
內文有0個圖片
image
0
內文有0個連結
link
0
內容預覽:
[問題敘述]:. 大家好,最近在練習用R跑NLP,目前處理英文文章,在斷詞方面我想使用自己的. 詞庫進行斷詞,例如文章中"My name is Pierce",正常斷詞會斷在空格處變成"My" "name""is" "Pierce",但我想使用自己的詞庫讓斷詞變成:"My name" "is" "P
(還有246個字)
#2
Re: [問題] NLP英文文章處理
推噓
2
(2推
0噓 3→
)
留言
5則,0人
參與
, 7年前
最新
作者
Darlsa
(WSP)
時間
7年前
發表
(2018/03/14 21:25)
,
編輯
資訊
0篇文章回應此文
0
內文有0個圖片
image
0
內文有0個連結
link
0
內容預覽:
嗨,我之前處理tm的時候,也有遇到同樣的問題,. 我要抓雙字詞的出現頻率,但tm包都會直接分成兩個字,. 例如「social design」會被分成「social」跟「design」,. 我的做法是直接把兩個字的空格去掉,黏在一起,然後用gsub()把原文替換成黏起來的,這樣tm包在處理的時候,就會
首頁
上一頁
1
下一頁
尾頁