Re: [問題] 如何把utf8所有的標點符號取代掉?

看板Perl作者 (宣)時間16年前 (2009/04/28 20:50), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串5/6 (看更多)
這兩天照著你提供的方向試了 可是在讀檔的時候出現下面的訊息 utf8 "\xB0" does not map to Unicode at E:\doc\20090325Program_jdwang\Program\test2.pl line 23, <FILEHANDLE> line 668. 我查了"\xB0"是"°"角度的符號 該不會是我這樣寫把檔案從utf8轉成Unicode了吧 以下是我的程式碼!!應該是沒問題!! use utf8; use strict; use encoding 'utf8', STDIN => 'utf8', STDOUT => 'utf8'; my $InputFile ='A_1_200_20080101_20081231.txt'; open (FILEHANDLE, "<:encoding(UTF-8)", "$InputFile") or die "can't not open $InputFile"; while(my $line = <FILEHANDLE>){ print $line; } close (FILEHANDLE); ※ 引述《kornelius (c9s)》之銘言: : 請 $ file your_file 一下,看一下 encoding 為何 : 如果你是用 windows 的筆記本,很有可能還是 big5 encoding. : 假設你的檔案已經是 utf8 , 可以在開檔就指定以 utf8 讀入 : open my $fh, '<:encoding(UTF-8)', 'file'; : 如果你是讀入 big5 檔案,請使用 from_to 做轉換 : use Encode 'from_to'; : $utf8 = from_to($big5, "big5", "utf8"); : 相關資料: : perldoc -f open : perldoc Encode : perldoc perluniintro : : 推 piglon:我是用perl5.10 04/21 20:24 : : 推 piglon:我寫了另一支程式測試是可以的 應該是我輸入有問題 04/21 20:36 : : → kornelius:應該是你的 input 非 utf8. 04/21 20:42 : : → kornelius:please use Encode module. 04/21 20:42 : : 推 piglon:不好意思我不會使用Encode module 雖然有人做筆記但看不懂 04/21 22:00 : : 推 piglon:我輸入的檔案用筆記本打開是utf8可是卻又比對不到= = 04/21 22:31 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 120.108.60.84
文章代碼(AID): #19zlk8Ki (Perl)
討論串 (同標題文章)
文章代碼(AID): #19zlk8Ki (Perl)