[問題] 自動判斷繁,簡體?

看板Python作者 (HIHIHI)時間15年前 (2010/01/11 17:43), 編輯推噓0(005)
留言5則, 2人參與, 最新討論串1/3 (看更多)
請問: 如果 ch變數 是一個有可能是簡體字或繁體字的 unicode字串 那有辦法在程式中判斷ch是繁體字或簡體字嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.124.185.18

01/11 23:11, , 1F
安裝chardet套件即可判斷繁體字與簡體字
01/11 23:11, 1F

01/11 23:16, , 2F
先import charet 再chardet.detect(ch)即可
01/11 23:16, 2F

02/04 00:21, , 3F
其實我遇到文字內容夾雜各種編碼,我想全部都轉成 utf-8
02/04 00:21, 3F

02/04 00:22, , 4F
但是有些編碼卻沒有辦法轉成 utf-8,目前只有以 ? 去代替
02/04 00:22, 4F

02/04 00:22, , 5F
不知道各位有沒有什麼樣的解決辦法.
02/04 00:22, 5F
文章代碼(AID): #1BIlBS0T (Python)
討論串 (同標題文章)
文章代碼(AID): #1BIlBS0T (Python)