PTT數位生活區 / Python

[問題] txt檔案裡面unicode的儲存轉換

看板Python作者tacosung時間14年前 (2012/03/05 18:21)推噓0(0推 0噓 8→)

留言8則, 2人參與討論串1/1

剛剛突然查到資料~ 發現txt檔案裡面的"unicode" 基本上是 "utf-16"的意思而且如果我的中文語料一開始如果是以utf-8存取, 要重新讓他以utf-16儲存的話, 會有少部分字變成亂碼要先把檔案以ANSI儲存, 再重新用python寫入儲存成utf-16才會變成正常的所以目前是解決這個小小的怪問題: 附上我的codes, 感謝有這個版!! import codecs import os import re cwd = 'ckip_trans' # raw data directory for i in os.listdir(cwd): file = codecs.open('ckip_trans_out/'+i,'w', encoding='utf-16') #output asbc = codecs.open('ckip_trans/'+i).read().decode('cp950') file.write(asbc) file.close() 謝謝~ 希望對之後的人有一些小幫助作者: tacosung (taco) 看板: Python 標題: [問題] txt檔案裡面unicode的儲存轉換時間: Mon Mar 5 18:21:06 2012 大家好~ 我目前手邊有一個單機版的斷詞系統, 每一筆語料都儲存在txt檔案裡面, 可是現在問題是... 那個txt檔案如果不是選擇'unicode'儲存的話, 送進去斷詞後, 都會變成亂碼! (即使是選擇以'utf-8'儲存, 回傳結果一樣是亂碼) 想問一下, 如果要用python寫一個script讓所有的txt檔案儲存成txt裡面的 'unicode'模式, 要怎麼在encoding選擇? 因為encoding裡面沒有"unicode", 只有'utf-8','cp950'等等之類的... 先感謝回答, 這困擾我一陣子了 = = -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 115.43.113.85

→

03/05 18:31, , 1^F

03/05 18:31, 1^F

→

03/05 18:31, , 2^F

03/05 18:31, 2^F

→

03/05 18:42, , 3^F

03/05 18:42, 3^F

→

03/05 18:44, , 4^F

03/05 18:44, 4^F

→

03/05 18:44, , 5^F

03/05 18:44, 5^F

→

03/05 18:45, , 6^F

03/05 18:45, 6^F

※ 編輯: tacosung 來自: 115.43.113.85 (03/05 19:17)

→

03/06 14:16, , 7^F

03/06 14:16, 7^F

→

03/06 14:16, , 8^F

03/06 14:16, 8^F

‣ 返回看板[ Python ] 程設

‣ 更多 tacosung 的文章

文章代碼(AID): #1FL9ELMx (Python)

Python 近期熱門文章

2

11

[問題] openpyxl到底能不能調整全局Font？

1月前, 05/07

7

21

[問題] super() 與MRO 鏈斷裂問題

3月前, 02/24

3

13

[問題] vscode的debug模式不用考慮中文路徑

4月前, 02/01

1

15

[問題] skimage.io.imread()讀圖檔底色是黃色？

5月前, 12/28

2

4

[閒聊] 有人要合購股票pythony資料庫finlab嗎?

5月前, 12/23

1

1

[問題] python 3.14 free thread build

7月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

7月前, 10/22

6

9

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

8月前, 10/09

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

-2

17

[閒聊] 電供和主機板會隨著配件老化而衝突嗎

[ PC_Shopping ]

2小時前, 06/14

2

9

[問題] iphone 16 pro max 關機仍發燙

2小時前, 06/14

5

78

[討論] 手機評測跑分終究是圖一樂而已

3小時前, 06/14

-6

7

台灣想找妹妹的來tw69880已刪文

3小時前, 06/14

22

93

[討論]極客灣事件是不是證明了只有iphone能買

4小時前, 06/14

21

64

[請益] 9070xt hotspot過高？

[ PC_Shopping ]

4小時前, 06/14

2

29

[菜單] 45k 客廳linux遊戲機

[ PC_Shopping ]

5小時前, 06/14

4

10

Re: [請益] 27吋2K螢幕求推薦

[ PC_Shopping ]

6小時前, 06/14

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 tacosung 的文章

文章代碼(AID): #1FL9ELMx (Python)