[分享] OpenCC中文轉換python3

看板Python作者 (蒼穹之下任我行)時間9年前 (2016/01/15 16:25), 編輯推噓0(005)
留言5則, 2人參與, 最新討論串1/1
在做中文轉換, OpenCC強悍好用, 但是現階段的版本並沒有直接支援python, pip中的opencc則是需要先安裝OpenCC, 用ctype載入, 在包裝跨平台上似乎較不便 於是用OpenCC本身的字典檔, 寫了純用python3的opencc, 不需要額外的套件 使用方式就是把opencc這個資料夾放到專案中, 然後import就可以了. 效能上沒有跟原本OpenCC比較過, 不過在字數不多的轉換上都還可以接受. source code: https://github.com/yichen0831/opencc-python 使用範例: from opencc import OpenCC openCC = OpenCC('t2s') # 正體中文轉簡體中文 to_convert = '我要轉成簡體中文' converted = openCC.convert(to_convert) 原本OpenCC所有的轉換都可以使用,如hk2s, s2twp等等. 目前有的問題是如果轉換字詞時, 有兩種以上的可能時, 程式只會取第一個來用 如果有問題或改進的建議, 歡迎交流指教! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.244.41.5 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1452846348.A.0C1.html

01/15 17:48, , 1F
可以考慮把它變成一個 package, 方便 pip install
01/15 17:48, 1F

01/15 17:48, , 2F
只要加 setup.py 與一個 MANIFEST.in (用來標示哪些檔案
01/15 17:48, 2F

01/15 17:48, , 3F
需要被安裝) 即可, 散佈起來會方便很多
01/15 17:48, 3F

01/15 17:49, , 4F
另外你 redistribute OpenCC 設定檔應該附上他們的授權
01/15 17:49, 4F

01/15 19:52, , 5F
謝謝提醒,我來研究一下如何弄成package以及授權的問題
01/15 19:52, 5F
文章代碼(AID): #1McAqC31 (Python)
文章代碼(AID): #1McAqC31 (Python)