PTT數位生活區 / Python

[問題] 大量資料程式抓取

看板Python作者sariel0322 (sariel)時間11年前 (2014/12/22 17:09)推噓2(2推 0噓 10→)

留言12則, 4人參與討論串1/2 (看更多)

大家好，我想在一個csv裡面抓取可能只出現的一筆的那一行資料(或兩筆、三筆) 我寫了一個code，希望能用最快的速度將資料抓出來已經在server上跑了結果似乎是卡住了? 目前問題: 有試過比較小資料量的資料，跑出來是可以的可能是我的資料量太大，因此他跑到出現我設定的"start output"就靜止在那邊了以下是我的code: import csv from collections import defaultdict protein_table = defaultdict(list) P = [] a = int(raw_input("times: ")) out = str(a+1) + " domain protein.csv" o = open(out,"w") f = open("multiple domain protein.csv","r") for row in csv.reader(f): P.append(row[1]) protein_table[row[1]].append(row[0]+","+row[1]+","+row[2]+","+row[3]+","+row[4]+"\n") print "----------------------start output-------------------" for i in [k for k in P if P.count(k)==a]: if i in protein_table: for protein in protein_table[i]: o.write(protein) o.flush() o.close() f.close() 請問大家有什麼比較好修改的地方嗎? 還是得寫跑比較久的迴圈之類的 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 120.126.36.171 ※ 文章網址: http://www.ptt.cc/bbs/Python/M.1419239375.A.EE5.html

→

12/22 18:16, , 1^F

12/22 18:16, 1^F

→

12/22 18:16, , 2^F

12/22 18:16, 2^F

→

12/22 18:16, , 3^F

12/22 18:16, 3^F

→

12/22 18:16, , 4^F

12/22 18:16, 4^F

→

12/22 18:16, , 5^F

12/22 18:16, 5^F

→

12/22 18:17, , 6^F

12/22 18:17, 6^F

→

12/22 18:18, , 7^F

12/22 18:18, 7^F

→

12/22 18:18, , 8^F

12/22 18:18, 8^F

→

12/22 18:25, , 9^F

12/22 18:25, 9^F

→

12/22 18:26, , 10^F

12/22 18:26, 10^F

推

12/23 08:25, , 11^F

12/23 08:25, 11^F

推

01/26 22:18, , 12^F

01/26 22:18, 12^F

‣ 返回看板[ Python ] 程設

‣ 更多 sariel0322 的文章

文章代碼(AID): #1Kbz_Fxb (Python)

討論串 (同標題文章)

完整討論串 (本文為第 1 之 2 篇)：

排序：最新先 | 最舊先 | 留言數

1

1

Re: [問題] 大量資料程式抓取

11年前, 12/22

2

12

[問題] 大量資料程式抓取

11年前, 12/22

在新視窗開啟完整討論串 (共2篇)

Python 近期熱門文章

3

13

[問題] vscode的debug模式不用考慮中文路徑

2周前, 02/01

1

1

[問題] python 3.14 free thread build

3月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

3月前, 10/22

6

9

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

4月前, 10/09

4

21

[閒聊] Python 3.13 版本是不是很爛啊！？

7月前, 07/19

15

23

[閒聊] 各位現在用os.path 還是用pathlib.Path

7月前, 07/17

6

11

[閒聊] 2024年的自我python學習

7月前, 07/17

1

2

[問題] 用Whisper AI幫我下載字幕（有酬）

10月前, 04/01

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

5

8

[新聞]貴重如金恆久如鑽？土耳其新人喜獲親友贈

[ PC_Shopping ]

2小時前, 02/17

60

82

[開箱] MSI MPG X870E CARBON MAX WIFI PTT EDI置底

[ PC_Shopping ]

4小時前, 02/17

3

6

[問題] XLR線挑選

5小時前, 02/17

-2

17

[心得] 4G分享器vs手機網路速度測試

5小時前, 02/17

4

9

[問題] 台哥大廣告簡訊

6小時前, 02/17

4

7

Re: [閒聊] 除夕夜換換病發作，求退燒

8小時前, 02/17

12

27

[請益] 換耳擴後大編制很爽，但中頻後退縮水

11小時前, 02/17

6

15

[問題] 換前級後大編制很爽，但中頻後退縮水

11小時前, 02/17

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 sariel0322 的文章

文章代碼(AID): #1Kbz_Fxb (Python)