[問題] 移除重複的打卡記錄(已解決

看板Python作者時間6年前 (2019/04/11 05:11), 6年前編輯推噓0(003)
留言3則, 2人參與, 6年前最新討論串1/1
各位好 001 AAA 2019/03/19 002 10:12:32 上班 001 AAA 2019/03/19 002 10:12:45 上班 001 AAA 2019/03/19 002 10:13:10 上班 001 AAA 2019/03/19 002 20:34:53 下班 我手上有一份打卡記錄如上面所示 3/19 上班有打卡的紀錄三筆 但是我只需要第一筆(最早打卡成功) 請問我要怎麼在python裡面移除中間的兩筆? 資料用Pandas讀進來的 要用什麼方法來清理這份資料? 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 70.93.230.230 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1554930661.A.E30.html

04/11 07:09, 6年前 , 1F
pandas.DataFrame.duplicated keep first
04/11 07:09, 1F

04/11 09:32, 6年前 , 2F
感謝
04/11 09:32, 2F
結果實際coding之後遇到一個小麻煩 001 AAA 2019/03/19 002 10:12:32 上班 001 AAA 2019/03/19 002 10:12:45 上班 001 AAA 2019/03/19 002 10:13:10 上班 001 AAA 2019/03/19 002 20:34:53 下班 001 BBB 2019/03/19 002 10:12:32 上班 001 BBB 2019/03/19 002 10:12:45 上班 001 BBB 2019/03/19 002 10:13:10 上班 001 BBB 2019/03/19 002 20:34:53 下班 如果我用 pd.drop_duplicates(['日期'],keep='first') 會只剩下 001 AAA 2019/03/19 002 10:12:32 上班 因為日期是一樣的 然後只保留第一個 請問要怎麼選擇[姓名][日期][上班or下班] 然後再移除重複的 我現在想到的是 把人名用loop 但是還是需要日期/上下班兩個column 請問有什麼好方法或是library可以用嗎 謝謝 ※ 編輯: s82237823 (134.173.253.56), 04/11/2019 10:47:57

04/11 10:52, 6年前 , 3F
已解決 用subset可以選多個column
04/11 10:52, 3F
文章代碼(AID): #1Shblbum (Python)
文章代碼(AID): #1Shblbum (Python)