[分享] OpenCC中文轉換python3
在做中文轉換, OpenCC強悍好用, 但是現階段的版本並沒有直接支援python,
pip中的opencc則是需要先安裝OpenCC, 用ctype載入, 在包裝跨平台上似乎較不便
於是用OpenCC本身的字典檔, 寫了純用python3的opencc, 不需要額外的套件
使用方式就是把opencc這個資料夾放到專案中, 然後import就可以了.
效能上沒有跟原本OpenCC比較過, 不過在字數不多的轉換上都還可以接受.
source code: https://github.com/yichen0831/opencc-python
使用範例:
from opencc import OpenCC
openCC = OpenCC('t2s') # 正體中文轉簡體中文
to_convert = '我要轉成簡體中文'
converted = openCC.convert(to_convert)
原本OpenCC所有的轉換都可以使用,如hk2s, s2twp等等.
目前有的問題是如果轉換字詞時, 有兩種以上的可能時, 程式只會取第一個來用
如果有問題或改進的建議, 歡迎交流指教!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.244.41.5
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1452846348.A.0C1.html
→
01/15 17:48, , 1F
01/15 17:48, 1F
→
01/15 17:48, , 2F
01/15 17:48, 2F
→
01/15 17:48, , 3F
01/15 17:48, 3F
→
01/15 17:49, , 4F
01/15 17:49, 4F
→
01/15 19:52, , 5F
01/15 19:52, 5F
Python 近期熱門文章
PTT數位生活區 即時熱門文章