[請問] 如何分辦文字檔哪些是ansi碼哪些是utf8碼

看板EZsoft (小軟體)作者 (阿阿)時間10年前 (2015/06/22 22:47), 編輯推噓3(3017)
留言20則, 5人參與, 最新討論串1/1
目前需將某資料夾的所有文字檔約4百多個合併成一個文字檔 所以在cmd下指令type *.txt >> test 結果發現產生的檔案會有部份亂碼, 原因是資料夾裡某些txt檔是用ansi編碼,而非UTF-8編碼 由於在資料夾裡都只顯示txt,不知道哪個是ansi編碼,哪個是UTF-8編碼。 若用手動一一打開檔案,再把ansi編碼的檔案改存UTF-8,實在太費工了。 另外有試著用ConvertZ批次轉檔,惟ConvertZ只接受全部為ansi檔才可批次轉。 所以有何方法或工具可辦別資料夾裡的txt檔,哪些ansi編碼,哪些為UTF-8編碼? 使我能把這些ansi編碼的文件挑出來,再餵給ConvertZ批次轉檔。 嘗試了一個晚上+Googl爬文無解,只好問板上的強者了, 感謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.251.148.216 ※ 文章網址: https://www.ptt.cc/bbs/EZsoft/M.1434984440.A.A54.html

06/22 22:52, , 1F
您對utf-8的似乎有誤解 而且cmd本來就不是utf-8編碼
06/22 22:52, 1F

06/22 22:52, , 2F
所以顯示不出來很正常...
06/22 22:52, 2F

06/22 23:11, , 3F
不會耶。在cmd底下打type *.txt >> test
06/22 23:11, 3F

06/22 23:12, , 4F
原先是UTF-8編碼的檔案不會有問題,而是原先ansi編碼的檔
06/22 23:12, 4F

06/22 23:13, , 5F
案,在匯入test檔中,都變成亂碼了@@
06/22 23:13, 5F

06/23 00:11, , 6F
06/23 00:11, 6F

06/23 00:12, , 7F
最後先備分再試,注意事項有特別列出來無法恢復
06/23 00:12, 7F

06/23 12:01, , 8F
搜尋txt列出全部文字檔 拖曳到14.6版以上的Emeditor中
06/23 12:01, 8F

06/23 12:03, , 9F
Ctrl+F搜尋 規則運算式打勾 搜尋群組中所有文檔打勾
06/23 12:03, 9F

06/23 12:04, , 10F
搜尋\w 按全部抽出 會把非空行的內容全部整併到新文件
06/23 12:04, 10F

06/23 20:28, , 11F
樓上大大的方法是可行的,但缺點是有文字檔裡有些留白的
06/23 20:28, 11F

06/23 20:28, , 12F
空行都不見了,可否有保留它們的方法。
06/23 20:28, 12F

06/24 09:42, , 13F
改搜尋\r
06/24 09:42, 13F

06/24 22:18, , 14F
再次感謝樓上。
06/24 22:18, 14F

06/24 22:21, , 15F
另外我發現EmEditor有個功能,把所有目前開啟的檔案,
06/24 22:21, 15F

06/24 22:23, , 16F
"用指定編碼全部儲存",這樣便可把所有檔案改成UTF-8了。
06/24 22:23, 16F

06/24 22:24, , 17F
非常方便。
06/24 22:24, 17F

06/25 09:31, , 18F
咦原來有這功能阿XD 也感謝原PO
06/25 09:31, 18F

06/27 13:33, , 19F

06/27 13:34, , 20F
totalcmd 加這 plug-in 就可以了。
06/27 13:34, 20F
文章代碼(AID): #1LY1_ufK (EZsoft)
文章代碼(AID): #1LY1_ufK (EZsoft)