看板 [ Python ]
討論串[問題] 自動判斷繁,簡體?
共 3 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓1(1推 0噓 2→)留言3則,0人參與, 最新作者arelu (難搞的阿儒)時間15年前 (2010/02/05 09:47), 編輯資訊
0
0
0
內容預覽:
這邊給一個自動去偵測所有的編碼並轉成 utf-8. det = chardet.detect(string). string = unicode(string, det['encoding'],"replace").encode('utf-8'). 這樣子就可以自動偵測你目前是什麼樣子的編碼,. 只

推噓0(0推 0噓 8→)留言8則,0人參與, 最新作者tumc (HIHIHI)時間15年前 (2010/01/21 01:37), 編輯資訊
0
0
0
內容預覽:
試過chardet模組,似乎不行,google了一下chardet. 覺得它是可偵測big5,gbk等編碼,但跟我的問題不太一樣... 可能是我表達的不清楚,再重新解釋一下,看有沒有人可以幫忙... ch是unicode字串,它有可能是經由big5,gb2312的字串解碼而來:. 也就是: ch =
(還有10個字)

推噓0(0推 0噓 5→)留言5則,0人參與, 最新作者tumc (HIHIHI)時間15年前 (2010/01/11 17:43), 編輯資訊
0
0
0
內容預覽:
請問: 如果 ch變數 是一個有可能是簡體字或繁體字的 unicode字串. 那有辦法在程式中判斷ch是繁體字或簡體字嗎?. --. 發信站: 批踢踢實業坊(ptt.cc). ◆ From: 59.124.185.18.
首頁
上一頁
1
下一頁
尾頁