[問題] csv選取資料後如何存檔？

看板Python作者DKnex (DK)時間4年前 (2022/07/21 14:31)推噓2(2推 0噓 1→)

留言3則, 2人參與討論串1/1

大家好，小弟完全新手目前手邊有筆CSV資料原本是[48023 rows x 10 columns] 我目標是： 1.將CSV裡面10個column篩選其中3個即可 2.從這3個columns當中的“Rank”篩選只出現1的值 3.篩選完變[553 rows x 3 columns] 然後再從url_hash當中，篩選重複出現至少5次或以上的值 4.最後保留這些值輸出成新的CSV檔案 code如下： https://imgur.com/a/QdjZrET 我現在只進行到目標2，但我發現輸出新的CSV只有把檔案從10個columns變成3個並沒有只保留Rank只出現1的值（還是[48023 rows x 3 columns]）我猜測是沒把數據寫成dataframe所以存不了我篩選的資料但實在看不懂dataframe要如何操作我的目標2和3 希望能得到各位的指點,先謝謝大家。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.169.4.244 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1658385107.A.1CA.html

推

noshortcut4u

07/21 15:05, 4年前 , 1^F

07/21 15:05, 1^F

推

lycantrope

07/21 15:09, 4年前 , 2^F

07/21 15:09, 2^F

→

lycantrope

07/21 15:11, 4年前 , 3^F

07/21 15:11, 3^F

感謝樓上2位大大，我茅塞頓開QQ df = pd.read_csv('Book1.csv', usecols=["keyword_id", "rank", "url_hash"]) df = df[df["rank"] == 1] print(df) df.to_csv("test1.csv", index=False) CSV檔案出來立馬就縮短成我要的接下來剩下目標3，再從URL_HASH抓出重複出現5次的值QQ 謝謝兩位！ ※ 編輯: DKnex (118.169.4.244 臺灣), 07/21/2022 15:14:20

‣ 返回看板[ Python ] 程設

‣ 更多 DKnex 的文章

文章代碼(AID): #1YsFBJ7A (Python)