[問題] big5

看板Python作者 (huggie)時間17年前 (2008/09/13 15:10), 編輯推噓1(106)
留言7則, 3人參與, 最新討論串1/1
讀取 html時,發現 "碁" 這個字不是 big5 encoding 查了一下是似乎倚天的 extension? 這時怎麼處理? decode 時會這樣說: UnicodeDecodeError: 'big5' codec can't decode bytes in position 75-76: illegal multibyte sequence -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.104.221.85

09/13 15:23, , 1F
試試 big5-hkscs
09/13 15:23, 1F

09/13 15:35, , 2F
多謝, it works
09/13 15:35, 2F

09/13 15:35, , 3F
另外想問, 每次讀近來都得用 ''.decode() 有沒有辦法設定
09/13 15:35, 3F

09/13 15:36, , 4F
一次,或建立什麼wrapper
09/13 15:36, 4F

09/14 01:31, , 5F
你可以 subclass file object 作 wrapping
09/14 01:31, 5F

09/17 11:56, , 6F
物件在哪? os.file?
09/17 11:56, 6F

09/17 11:58, , 7F
好呆...好像沒這個東西..
09/17 11:58, 7F
文章代碼(AID): #18osT9DN (Python)
文章代碼(AID): #18osT9DN (Python)