[問題] pd.read_csv ParserError

看板Python作者 (【積π】)時間5年前 (2019/10/23 22:03), 5年前編輯推噓3(304)
留言7則, 2人參與, 5年前最新討論串1/1
df = pd.read_csv('test3.log', sep="\s+", header=None, prefix='COL') 文本分隔是以' '或大於一個空白切分 沒有header 但是當切到內容含有 // 時會報錯 ParserError: Error tokenizing data. C error: Expected 6 fields in line 2, saw 7 有查過使用error_bad_lines=False屬性 但想保留資料 想問問看是否有不需要replace整份文本而可以正常read_csv檔 因為csv檔又大又多,若是一行一行replace很耗時費力 感謝大大 -------------文本內容------------- Jan 2 07:50:41 clftp1 ftpd[14459]: NOOP Jan 2 07:50:41 clftp1 ftpd[14459]: CWD //MG11T36.1 Jan 2 07:50:41 clftp1 ftpd[14459]: PORT Jan 2 07:50:41 clftp1 ftpd[14459]: LIST -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.160.178.188 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1571839401.A.F84.html ※ 編輯: ctr1 (118.160.178.188 臺灣), 10/23/2019 22:16:14

10/23 22:36, 5年前 , 1F
這應該是因為你有多//所以導致attributes不一致 看你
10/23 22:36, 1F

10/23 22:37, 5年前 , 2F
要先做前處理移掉還是你指定要7個attributes 空值填N
10/23 22:37, 2F

10/23 22:37, 5年前 , 3F
aN
10/23 22:37, 3F

10/23 22:38, 5年前 , 4F
沒辦法read_csv->dataframe,是否只能一行一行的前處理呢
10/23 22:38, 4F

10/24 10:35, 5年前 , 5F
可以一行處理 就用python讀檔處理後再存新檔
10/24 10:35, 5F

10/24 11:14, 5年前 , 6F
https://bit.ly/2pcmswm 剛做的 可以參考一下
10/24 11:14, 6F

10/24 14:50, 5年前 , 7F
謝謝你~
10/24 14:50, 7F
文章代碼(AID): #1Ti5sf-4 (Python)
文章代碼(AID): #1Ti5sf-4 (Python)