Re: [問題] Excel資料做比較
※ 引述《os653 ()》之銘言:
: 有很多個月份的 Excel 想要做比較,基本上每個月一份 Excel
: 內容大概是某某東西某某月銷售多少,想計算銷售成長率
: 問題是資料有點雜
: 像是東西的名字不太固定,同月份的珍奶跟珍珠奶茶應該要併計
: 或是販售的場所名字略有不同,XX豆漿跟XX豆漿大王其實指的是同個東西
: 我自己想了兩個處理辦法
: 1. 不管內容,全部參在一起做成撒尿牛丸
: 直接把資料都讀進資料庫,像這樣
: 2015/03 XX豆漿大王 珍奶 100
: 2015/03 XX豆漿 珍奶 200
: 2015/04 XX豆漿大王 珍珠奶茶 300
: 2015/04 XX豆漿 珍珠奶茶 400
: 之後再回頭慢慢把同義不同名的資料合併
: 2. 先設計好資料庫,每一份 Excel 單獨寫一個 parser 去處理
: parser 要負責把同義不同名的資料修正後再丟進資料庫
: 請問這兩個做法那個比較好?或是有其他更適當的做法?
: 我自己覺得兩個做法都有點彆扭,還請各位提供點意見,感謝
當然是先parse再進資料庫,
不過沒說你資料量有多少,
讀進資料庫只要幾秒的量,
什麼做法也沒差了。
不過為什麼一個檔案一個parse,
每個檔案資料名稱差異很大嗎?
個人作法應該會是整個parse寫好,
自動open excel檔parse完直接塞資料庫,
就是一次寫完就放給它全自動完成,
不過重點還是在於parse做的準不準確吧。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.75.211
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1459444417.A.78A.html
推
04/01 05:52, , 1F
04/01 05:52, 1F
→
04/01 05:53, , 2F
04/01 05:53, 2F
→
04/01 05:54, , 3F
04/01 05:54, 3F
→
04/01 05:56, , 4F
04/01 05:56, 4F
→
04/01 05:56, , 5F
04/01 05:56, 5F
→
04/01 06:04, , 6F
04/01 06:04, 6F
→
04/01 06:04, , 7F
04/01 06:04, 7F
→
04/01 06:05, , 8F
04/01 06:05, 8F
推
04/01 09:50, , 9F
04/01 09:50, 9F
推
04/01 17:15, , 10F
04/01 17:15, 10F
推
04/01 21:57, , 11F
04/01 21:57, 11F
→
04/01 21:57, , 12F
04/01 21:57, 12F
→
04/01 21:58, , 13F
04/01 21:58, 13F
→
04/01 21:58, , 14F
04/01 21:58, 14F
→
04/01 21:59, , 15F
04/01 21:59, 15F
→
04/01 22:01, , 16F
04/01 22:01, 16F
→
04/01 22:01, , 17F
04/01 22:01, 17F
→
04/01 22:01, , 18F
04/01 22:01, 18F
→
04/01 22:02, , 19F
04/01 22:02, 19F
→
04/01 22:03, , 20F
04/01 22:03, 20F
→
04/01 22:04, , 21F
04/01 22:04, 21F
推
04/02 00:50, , 22F
04/02 00:50, 22F
討論串 (同標題文章)
Python 近期熱門文章
PTT數位生活區 即時熱門文章