PTT數位生活區 / Perl

Re: [問題] 把中文字切出來

看板Perl作者jjt (jet)時間18年前 (2007/11/23 10:19)推噓1(1推 0噓 0→)

留言1則, 1人參與討論串3/3 (看更多)

※ 引述《Dreamer77 (追夢)》之銘言： : 請問 : 要如何把中文一個字一個字切出來 : (輸入的可能是utf8 or big5 都有可能) : p,s 前面提供的方法 split(//,$string) : 我試了之後是不僅連英文都變成一個字母一個字母@@" : 而且中文會有亂碼.. : 不知道有沒有人知道方法 thanks 1. regular exp $lines="輸出的可能是utf8 or big5 都有可能"; my $big5 = "[\xA1-\xF9][\x40-\x7E\xA1-\xFE]"; my @words=$lines=~/($big5|\x0d\x0a|[\x21-\x7e]|\s+)/g; 2.decode<=>encode #用以下的話中文字length仍是 2 $lines=decode('big5',$lines); @words=split //,$lines; #中文字算是一個字元，所以會被切開 map {$_=encode('big5',$_)} @words; #切回去之前的模式，中文字兩個字元 3.other #用這招的話，中文字length會變成 1 use encoding 'big5', STDIN => 'big5', STDOUT => 'big5'; @words=split //,$lines; 用這三個方法，就可以隨意切換中文字的控制了要看要處理的內容來看用哪種比較好，我這三種都用過，各有各的好處跟壞處 #英文如果不要一個字一個字切開那就用第一條 my $big5 = "[\xA1-\xF9][\x40-\x7E\xA1-\xFE]"; my @words=$lines=~/($big5|\x0d\x0a|[\x21-\x7e]+ |\s+)/g; ～～～～～～多一個+ 應該是這樣我沒仔細去測試:p -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.121.197.133 ※ 編輯: jjt 來自: 140.121.197.133 (11/23 10:21)

推

11/23 16:09, , 1^F

11/23 16:09, 1^F

‣ 返回看板[ Perl ] 程設

‣ 更多 jjt 的文章

文章代碼(AID): #17HZYsch (Perl)

討論串 (同標題文章)

本文引述了以下文章的的內容：

3

3

[問題] 把中文字切出來

18年前, 11/22

完整討論串 (本文為第 3 之 3 篇)：

排序：最新先 | 最舊先 | 留言數

1

1

Re: [問題] 把中文字切出來

18年前, 11/23

4

5

Re: [問題] 把中文字切出來

18年前, 11/22

3

3

[問題] 把中文字切出來

18年前, 11/22

在新視窗開啟完整討論串 (共3篇)

Perl 近期熱門文章

1

7

Re: [問題] sleep與-e搭配應用

1年前, 06/19

2

15

[問題] 如何改善大文件的讀寫效能

2年前, 07/12

1

2

Re: [問題] 參照變數宣告及記憶體位置問題

3年前, 02/13

1

2

[問題] 參照變數宣告及記憶體位置問題

3年前, 02/07

3

5

Learing Perl 第八版中文版出版了

4年前, 06/22

2

4

[請益] 請教terminal 餵正規表示法給perl問題

5年前, 04/10

1

9

[問題] 是不是要放棄perl了

5年前, 03/02

1

1

[問題] 請問如何建立新的Row？(代po)

5年前, 11/23

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

6

73

Re: [心得] 華碩螢幕3修修不好，消保調解還出爾反爾

[ PC_Shopping ]

4小時前, 07/14

15

119

[問題] 台灣大(原台灣之星)日本收不到簡訊?

6小時前, 07/14

4

9

[開箱] 迷你小巧功能強大 ASUS 商用級 PN54-S1

[ PC_Shopping ]

6小時前, 07/14

8

16

[心得] 關於iOS26的耗電

7小時前, 07/14

7

41

[問題] 蘋果電池健康度的問題

9小時前, 07/14

5

17

Re: [新聞] 知名智能手機品牌一加即將撤出美國及歐洲

9小時前, 07/14

0

28

Re: [新聞] 知名智能手機品牌一加即將撤出美國及歐洲

11小時前, 07/14

3

13

[閒聊] ELECOM 有線拇指軌跡球滑鼠超級難用??

[ Key_Mou_Pad ]

11小時前, 07/14

更多即時熱門文章 >>

‣ 返回看板[ Perl ] 程設

‣ 更多 jjt 的文章

文章代碼(AID): #17HZYsch (Perl)