Re: [問題] 如何對中英文夾雜的字串切Token?
※ 引述《Falldog (嘿嘿~)》之銘言:
: 我試過判斷" "的方法
: 但是編碼的問是一直搞不定…總是會印出?????
: ps...一開始用getLine()是都讀得到中文字
: 但是再下去用String temp一個字一個字增加時就有問題了...
: BufferedReader br = new BufferedReader(new FileReader(
: new File(filename)));
: String line = br.getLine();
: String temp;
: int i=0;
: while( i<length && ( line.indexOf(i)!=' ' || line.indexOf(i)!='\n' )){
: temp += line.getBytes("ISO-8859-1")[i];
: i++;
: }
問題很簡單 bytes是二進位的資料
一個中文字會被拆成兩個字看....
環境允許的話 , 改用char處理吧....
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.138.240.58
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 3 篇):
java 近期熱門文章
PTT數位生活區 即時熱門文章