[問題]pandas轉換問題
求救版上的高手,小弟我又卡關了,
最近在做df的轉換,將爬蟲程式抓的CSV轉換成我要的格式,
可是卻遇到錯誤:Index contains duplicate entries, cannot reshape
我個人認為會出錯是當初網頁的資料問題,如連結:
http://webdata.bird.org.tw/contents.php?key=80002
從80002到80007的藍色欄位資料都是一樣的,所以我再用DF轉換的時候,
無法以欄位做分割每個獨立網頁資料
這有辦法解決嗎? 還是我需要做資料的比對?
scrapy抓下的資料CSV檔:
https://drive.google.com/open?id=0B6SUWnrBmDwSazZzRHN0UjkxaVE&authuser=0
code:
https://drive.google.com/open?id=0B6SUWnrBmDwSSVNjQnpwS0dqUUk&authuser=0
勞煩各位高手幫小弟的忙
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.127.51.228
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1426306774.A.015.html
Python 近期熱門文章
PTT數位生活區 即時熱門文章