[問題] for迴圈搭配regex效率問題

看板Python作者 (kk)時間6年前 (2019/02/22 11:01), 編輯推噓5(505)
留言10則, 7人參與, 6年前最新討論串1/1
小弟菜鳥 想詢問一下各位 目前寫的一個程式是要在2000篇文件中以regex找尋關鍵字出現與否 (以某些特徵出現) 而關鍵字的列表約有600萬個字 導致運算速率非常慢 如果想增進效率 不知能從什麼方面著手?謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.13.210.177 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1550804505.A.D27.html

02/22 11:25, 6年前 , 1F
列表內的項目有600萬個的意思?
02/22 11:25, 1F

02/22 11:29, 6年前 , 2F
是的 另外是字典不是列表 內文打錯了~
02/22 11:29, 2F

02/22 11:42, 6年前 , 3F
關鍵字彼此不會重疊嗎?可以試試看把常出現的放前面
02/22 11:42, 3F

02/22 12:10, 6年前 , 4F
丟平行?
02/22 12:10, 4F

02/22 12:55, 6年前 , 5F
FlashText
02/22 12:55, 5F

02/22 15:51, 6年前 , 6F
哪種類型的文件? 單純txt的話直接換工具比較快
02/22 15:51, 6F

02/22 20:28, 6年前 , 7F
允許預處理嗎 先把單字在哪個文件那一行記起來 之後用r
02/22 20:28, 7F

02/22 20:28, 6年前 , 8F
egex搜
02/22 20:28, 8F

03/07 11:49, 6年前 , 9F
謝謝大家回答,最後用flashtest解決了,之前推文沒送出
03/07 11:49, 9F

03/07 11:49, 6年前 , 10F
*text
03/07 11:49, 10F
文章代碼(AID): #1SRsOPqd (Python)
文章代碼(AID): #1SRsOPqd (Python)