Re: [問題] 如何對中英文夾雜的字串切Token?

看板java作者 (骨頭)時間19年前 (2006/04/01 04:48), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串2/3 (看更多)
※ 引述《Falldog (嘿嘿~)》之銘言: : 我試過判斷" "的方法 : 但是編碼的問是一直搞不定…總是會印出????? : ps...一開始用getLine()是都讀得到中文字 : 但是再下去用String temp一個字一個字增加時就有問題了... : BufferedReader br = new BufferedReader(new FileReader( : new File(filename))); : String line = br.getLine(); : String temp; : int i=0; : while( i<length && ( line.indexOf(i)!=' ' || line.indexOf(i)!='\n' )){ : temp += line.getBytes("ISO-8859-1")[i]; : i++; : } 問題很簡單 bytes是二進位的資料 一個中文字會被拆成兩個字看.... 環境允許的話 , 改用char處理吧.... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.138.240.58
文章代碼(AID): #14BPM1H8 (java)
文章代碼(AID): #14BPM1H8 (java)