Re: [問題] 中文文件中標點符號的取代
Code:
#!/usr/bin/perl
open(INITXT, "< $ARGV[0]") or die "cant write";
open(OUTTXT, "> $ARGV[1]") or die "cant write";
while($line=<INITXT>){
$line =~ s/,|?|!|:|;|…/。/g;
print OUTTXT $line;
}
---------------
Sample input:
一二三四五六七,
七六五四三二一。
一二三四:
四三二一;
---------------
Sample output:
一二三四五六七。
七六五四三二一。
一二三四。
四三二一。
※ 引述《firegsh (~\cite{yaranaiga})》之銘言:
: 請教另一個問題:
: 假設我有一個編碼為big5的中文文件,其中有許多標點符號,
: 如,。…!?
: 那麼我應該如何把所有標點符號統一為'。'呢?
: 目前試過s/,/。/g或是s/','/'。'/g都行不通,感謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 210.59.164.109
推
09/20 17:18, , 1F
09/20 17:18, 1F
推
09/21 13:40, , 2F
09/21 13:40, 2F
討論串 (同標題文章)
完整討論串 (本文為第 2 之 2 篇):
Perl 近期熱門文章
PTT數位生活區 即時熱門文章