看板
[ Perl ]
討論串[問題] 如何把utf8所有的標點符號取代掉?
共 6 篇文章
內容預覽:
utf8裡面是不會有落單的 \xB0 的. utf8裡面單位元的字元只有 \x00 - \x7F (ASCII). 雖然Unicode的(U+00B0)確實是那個符號.... 但是它在utf8裡面應該是 \xC2\xB0 (雙位元). 所以你的input顯然不是合法的UTF-8. 你或許能夠試試下面
(還有364個字)
內容預覽:
這兩天照著你提供的方向試了. 可是在讀檔的時候出現下面的訊息. utf8 "\xB0" does not map to Unicode at. E:\doc\20090325Program_jdwang\Program\test2.pl line 23, <FILEHANDLE> line 668.
(還有259個字)
內容預覽:
請 $ file your_file 一下,看一下 encoding 為何. 如果你是用 windows 的筆記本,很有可能還是 big5 encoding.. 假設你的檔案已經是 utf8 , 可以在開檔就指定以 utf8 讀入. open my $fh, '<:encoding(UTF-8)',
(還有132個字)