[問題] 又是中文編碼的問題
我在這裡看到這篇文章(http://goo.gl/lYCk7r)
大意是說,有些big5中文字,轉換時 python 會報錯。
例如 在big5中是"恒"字
#python3.3.2
print(b'\xf9\xda'.decode('big5'))
#UnicodeDecodeError: 'big5' codec can't decode
byte 0xf9 in position 0: illegal multibyte sequence
文中有提到這個字可以用big5hkscs來解碼,還是有一些
字無法解。
因為我常要大量轉碼,其實遇到的這情況的機率比想像中
高,我也不想要直接 ignore。
我現在想到的是遇到exception 就再試試別的編碼,但是
這實在有點笨。
一般你們在處理這些字時,會怎麼做呢?
後記:再看到這篇https://goo.gl/BYnSHz我就崩潰了。
※ 編輯: ggirls (114.136.150.153), 07/01/2016 11:09:06
※ 編輯: ggirls (114.136.150.153), 07/01/2016 11:19:09
→
07/01 11:47, , 1F
07/01 11:47, 1F
推
07/01 12:52, , 2F
07/01 12:52, 2F
→
07/01 13:16, , 3F
07/01 13:16, 3F
→
07/01 13:18, , 4F
07/01 13:18, 4F
→
07/01 13:18, , 5F
07/01 13:18, 5F
→
07/01 13:20, , 6F
07/01 13:20, 6F
※ 編輯: ggirls (114.136.150.153), 07/01/2016 13:30:23
→
07/01 13:29, , 7F
07/01 13:29, 7F
→
07/01 13:30, , 8F
07/01 13:30, 8F
→
07/01 13:30, , 9F
07/01 13:30, 9F
→
07/01 13:34, , 10F
07/01 13:34, 10F
→
07/01 13:35, , 11F
07/01 13:35, 11F
→
07/01 13:45, , 12F
07/01 13:45, 12F
→
07/01 13:48, , 13F
07/01 13:48, 13F
→
07/01 13:48, , 14F
07/01 13:48, 14F
※ 編輯: ggirls (114.136.150.153), 07/01/2016 14:33:33
→
07/01 15:35, , 15F
07/01 15:35, 15F
→
07/01 15:36, , 16F
07/01 15:36, 16F
→
07/01 18:39, , 17F
07/01 18:39, 17F
推
07/01 23:49, , 18F
07/01 23:49, 18F
→
07/02 07:42, , 19F
07/02 07:42, 19F
Python 近期熱門文章
PTT數位生活區 即時熱門文章