[問題] NLP英文文章處理

看板R_Language作者 (pierce)時間7年前 (2018/03/10 22:38), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/2 (看更多)
[問題敘述]: 大家好,最近在練習用R跑NLP,目前處理英文文章,在斷詞方面我想使用自己的 詞庫進行斷詞,例如文章中"My name is Pierce",正常斷詞會斷在空格處變成"My" "name" "is" "Pierce",但我想使用自己的詞庫讓斷詞變成:"My name" "is" "Pierce"。 目前Google關鍵字name entity recognition已經搜尋過,試過openNLP package, 但都沒有辦法達到我想要的效果(使用自己的詞庫進行斷詞),請問其他有經驗的大大有 什麼解決的辦法嗎? [環境敘述]: R version 3.4.2 (2017-09-28) Platform: x86_64-w64-mingw32/x64 (64-bit) Running under: Windows >= 8 x64 (build 9200) [關鍵字]: NLP、斷詞、name entity recognition -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.173.18.45 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1520692726.A.69A.html
文章代碼(AID): #1Qe-tsQQ (R_Language)
討論串 (同標題文章)
文章代碼(AID): #1Qe-tsQQ (R_Language)