[問題] 移除重複的打卡記錄(已解決
各位好
001 AAA 2019/03/19 002 10:12:32 上班
001 AAA 2019/03/19 002 10:12:45 上班
001 AAA 2019/03/19 002 10:13:10 上班
001 AAA 2019/03/19 002 20:34:53 下班
我手上有一份打卡記錄如上面所示
3/19 上班有打卡的紀錄三筆
但是我只需要第一筆(最早打卡成功)
請問我要怎麼在python裡面移除中間的兩筆?
資料用Pandas讀進來的
要用什麼方法來清理這份資料?
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 70.93.230.230
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1554930661.A.E30.html
→
04/11 07:09,
6年前
, 1F
04/11 07:09, 1F
→
04/11 09:32,
6年前
, 2F
04/11 09:32, 2F
結果實際coding之後遇到一個小麻煩
001 AAA 2019/03/19 002 10:12:32 上班
001 AAA 2019/03/19 002 10:12:45 上班
001 AAA 2019/03/19 002 10:13:10 上班
001 AAA 2019/03/19 002 20:34:53 下班
001 BBB 2019/03/19 002 10:12:32 上班
001 BBB 2019/03/19 002 10:12:45 上班
001 BBB 2019/03/19 002 10:13:10 上班
001 BBB 2019/03/19 002 20:34:53 下班
如果我用 pd.drop_duplicates(['日期'],keep='first')
會只剩下
001 AAA 2019/03/19 002 10:12:32 上班
因為日期是一樣的 然後只保留第一個
請問要怎麼選擇[姓名][日期][上班or下班]
然後再移除重複的
我現在想到的是 把人名用loop
但是還是需要日期/上下班兩個column
請問有什麼好方法或是library可以用嗎
謝謝
※ 編輯: s82237823 (134.173.253.56), 04/11/2019 10:47:57
→
04/11 10:52,
6年前
, 3F
04/11 10:52, 3F
Python 近期熱門文章
PTT數位生活區 即時熱門文章