
Re: [問題] 編碼問題

: 為什麼我照片中兩種得到值不一樣?
: 我在command 下
: #-*- coding: utf-8 -*-
: print repr('科科')
: 改成
: print repr(u'科科')
: 也不行 , 他們之前差異在哪? 為什麼會造成這邊差異?
: 謝謝
大概搞懂了
(中文的)Windows 版 Python shell 預設會用 Big5
0xACEC 是科的 Big5 編碼
當你在檔頭指定編碼時, 該檔案內的字串就會使用那個編碼
所以你 (1) 裡會是 0xE7A791, 這是科的 UTF-8 編碼
當你(在 Python 2)使用 u 前綴, 這個字串常數就會是 unicode 物件, 不是 str
\uxxxx 的形式代表這是 Unicode 字串, 不是位元組字串
而 0x79D1 即是科的 Unicode 值
--
╱ ̄ ̄ ̄╲
▏◢█◣ ▏
︻█︻█ ▏ 成龍表示: 是喔...
′/ ‵ ▏
╰╯ █╱
ψQSWEET ◥︶█◤
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.32.81.146
討論串 (同標題文章)
Python 近期熱門文章
PTT數位生活區 即時熱門文章