[問題] pandas read_sql(mysql) 資料大時很慢

看板Python作者 (天氣真好)時間7年前 (2018/07/29 16:13), 編輯推噓1(101)
留言2則, 2人參與, 7年前最新討論串1/1
如題 同一段語法,查詢結果約數百萬筆,有三個欄位varchar ,datetime ,float 情況 一.使用mysql workbench 測試sql語法,duration 7.551s,fetch 20.654s 二.使用pandas read_sql 未使用chunksize,跑超過半小時跑不出來,ram沒有動 使用chunksize 也沒有改善 (pymysql + sqlalchemy) 連到db server 看mysql workbench的dash board, 在Outgoing Network Traffic 部分,情況一的流量比情況二明顯多很多, 而且情況二的流量不太連續。 在InnoDB Disk Reads的狀況也是一樣。 不知道pandas 這邊還有什麼調校手法可以使用,再麻煩先進指點一下! 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.225.109.87 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1532852039.A.F7C.html

07/29 16:56, 7年前 , 1F
看到一些分析說pymysql 很慢,換成mysqldb 2分鐘可跑出來
07/29 16:56, 1F

07/29 23:30, 7年前 , 2F
試試看先讀少量的data 看記憶體消耗的程度
07/29 23:30, 2F
文章代碼(AID): #1RNNT7zy (Python)
文章代碼(AID): #1RNNT7zy (Python)