[問題] 請問項目計算
大家好:
最近剛學 Python ,學習到從抓取奧運csv檔進行相關統計,
其中練習2--我要算某國的得獎總數
練習2答案如下:
events = df[df['NOC'] == 'CHN'].drop_duplicates
(subset = ['Event', 'Games'], inplace = False)
我的問題
Q1:我在導入CSV時,已經做過
p_duplicates(subset = ["Name","Sex","Age","Height","Weight","Team","NOC","Games","Year","Season","City","Sport","Event","Medal"],
inplace = True)
為什麼練習2還要再去重?
Q2:我本來是用events = df[df['NOC'] == 'CHN'].counts()
和events = df[df['NOC'] == 'CHN'].value_counts()
不過第一個數字不對,第二個出現錯誤
請問問題在哪?
Q3: inplace=True/False ,書上是說,True是在原資料做去重,False是另外創建一組資料,
可是True時,我看他資料df還是未去重,是我誤會了嗎?
請大大幫忙指點,thx
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.117.51.124 (中國)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1606055739.A.5F4.html
推
11/22 23:28,
4年前
, 1F
11/22 23:28, 1F
推
11/22 23:59,
4年前
, 2F
11/22 23:59, 2F
推
11/23 00:43,
4年前
, 3F
11/23 00:43, 3F
→
11/23 00:44,
4年前
, 4F
11/23 00:44, 4F
→
11/23 00:45,
4年前
, 5F
11/23 00:45, 5F
→
11/23 00:45,
4年前
, 6F
11/23 00:45, 6F
→
11/23 00:46,
4年前
, 7F
11/23 00:46, 7F
推
11/23 05:31,
4年前
, 8F
11/23 05:31, 8F
→
11/23 05:31,
4年前
, 9F
11/23 05:31, 9F
→
11/23 05:38,
4年前
, 10F
11/23 05:38, 10F
→
11/23 05:39,
4年前
, 11F
11/23 05:39, 11F
推
11/23 05:42,
4年前
, 12F
11/23 05:42, 12F
Python 近期熱門文章
PTT數位生活區 即時熱門文章