[問題] jiebaR 針對文字檔讀取檔案處理

看板R_Language作者時間9年前 (2016/09/11 04:17), 9年前編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/2 (看更多)
作者: wanson (望生) 看板: R_Language 標題: [問題] jiebaR 針對文字檔處理 時間: Sun Sep 11 04:17:05 2016 請問一下 他的教學網站中提到"./temp.dat" 可以load 檔案進去 以下是他的說明 支持对文件进行分词: cc["./temp.dat"] ### 自动判断输入文件编码模式,默认文件输出在同目录下。 ## segment( "./temp.dat" , mixseg ) 英文說明 You can pipe a file path to cut file. cutter <= "./temp.dat" ### Auto encoding detection. ## OR segment( "./temp.dat" , cutter ) 很奇怪的是我自己怎樣嘗試都無法成功 這是我自己的目錄 setwd("C:/SASMACRO/data/F2+Blank") mixseg <= "./temp.dat" 另外我如果使用read_table 去讀取txt檔案,如果檔案內只有簡單的幾個字 讀檔可以成功 但如果檔案有點大,而且一開始很多分行 就會失敗 例如下列的檔案 (temp.txt) https://www.dropbox.com/s/wdwgk8t64xgrlu9/temp.txt?dl=0 怎樣也都無法讀進去 想請教一下版上的高手 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.211.164 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1473538629.A.489.html ※ 編輯: wanson (140.112.211.164), 09/11/2016 04:29:40
文章代碼(AID): #1Nr6f5I9 (R_Language)
文章代碼(AID): #1Nr6f5I9 (R_Language)