PTT數位生活區 / Python

Re: [問題] 中文編碼問題

看板Python作者ccwang002 (亮)時間11年前 (2015/07/15 23:10)推噓1(1推 0噓 0→)

留言1則, 1人參與討論串2/5 (看更多)

※ 引述《Czero (悠閒)》之銘言： : 使用python3~ : 假設我取得一個中文已經編碼過的字串 : d='\\xab\\xa2\\xc5o' : print(d) : 我想要印出原始中文該如何印呢? （恕刪） EDIT: TP 大大給了個比較好的方法： >>> cleaned = d.encode('latin1').decode('unicode_escape') >>> cleaned '\xab\xa2\xc5o' >>> cleaned.encode('latin1').decode('big5') '哈囉' 下面是用硬幹的效率很差。這個東西要還原要一些工夫，首先 '\xab' 這是一個 char， '\\xab' 是三個 char 所以要回復就要強制做先把 'ab' 換成 16 進位表示的值，再轉成 char >>> int('ab', 16) 171 >>> chr(int('ab', 16)) # 等同於 chr(171) '\xab' 寫成完整的 code import re d = '\\xab\\xa2\\xc5o' unit_repr_regex = r'(\\x[0-9a-f]{2})' repr_to_chr = { s: chr(int(s[-2:]), 16) for s in set(re.findall(unit_repr_regex, d)) } d_corrected = d for chr_repr, chr_ in repr_to_chr: d_corrected = d_corrected.replace(chr_repr, chr_) d_corrected = d_corrected.encode('latin1').decode('big5') print(d_corrected) # 哈囉 PS 注意中間有個變數為了不要蓋到內建函式 chr() 命名成 chr_ PS2 如果轉換很多的話，不妨 repr_to_chr 直接建完 0-255 所有情況 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.44.9.167 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1436973024.A.D79.html ※ 編輯: ccwang002 (114.44.9.167), 07/15/2015 23:18:09

推

07/16 01:46, , 1^F

07/16 01:46, 1^F

‣ 返回看板[ Python ] 程設

‣ 更多 ccwang002 的文章

文章代碼(AID): #1LfdVWrv (Python)

討論串 (同標題文章)

本文引述了以下文章的的內容：

0

14

[問題] 中文編碼問題

11年前, 07/15

完整討論串 (本文為第 2 之 5 篇)：

排序：最新先 | 最舊先 | 留言數

[問題] 中文編碼問題已刪文

6年前, 07/09

2

4

[問題] 中文編碼問題

8年前, 11/27

3

4

[問題] 中文編碼問題

9年前, 12/22

1

1

Re: [問題] 中文編碼問題

11年前, 07/15

0

14

[問題] 中文編碼問題

11年前, 07/15

在新視窗開啟完整討論串 (共5篇)

Python 近期熱門文章

2

12

[問題] 公司電腦無法透過python讀取usb攝像頭

2周前, 07/08

2

11

[問題] openpyxl到底能不能調整全局Font？

2月前, 05/07

7

21

[問題] super() 與MRO 鏈斷裂問題

5月前, 02/24

3

13

[問題] vscode的debug模式不用考慮中文路徑

5月前, 02/01

1

15

[問題] skimage.io.imread()讀圖檔底色是黃色？

6月前, 12/28

2

4

[閒聊] 有人要合購股票pythony資料庫finlab嗎?

7月前, 12/23

1

1

[問題] python 3.14 free thread build

8月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

9月前, 10/22

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

4

11

[討論] 換iphone機較不會受中國網站病毒影響?

1小時前, 07/25

6

51

[菜單] 200K 遊戲機兼本地AI

[ PC_Shopping ]

6小時前, 07/25

4

7

[問題] 請問小米17Ultra用哪款保護貼對指紋輸入

6小時前, 07/25

4

26

[菜單] 55K-60K遊戲機

[ PC_Shopping ]

8小時前, 07/25

3

65

[問題] 中國大陸收台灣簡訊

8小時前, 07/25

4

21

[問題] 預算2萬內長焦段拍照錄影最佳的選擇

8小時前, 07/25

10

30

[問題] 想詢問現在小平板購買的選擇

9小時前, 07/25

7

10

[開箱] JONSBO TK-5機殼

[ PC_Shopping ]

10小時前, 07/25

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 ccwang002 的文章

文章代碼(AID): #1LfdVWrv (Python)