Re: [問題]讀取文字檔(170MB),且處理內容的方法已回收
※ 引述《idealgas314 (爆的一塌糊塗(b))》之銘言:
: 請教一下各位
: 目前我的手上有一組數據,是分析基因序列的機率
: 像是我有一組文字
: ATGC
: 會對應一組機率分數
: (40 -40 -40 -40) (-40 35 -40 -40) (-35 -30 40 -10) (0 -35 -20 15)
: 我必須要挑出 括弧內最大值作為機率分數
: 將這些機率分數最大值重新建立新的檔案
: 問題來了
: 我每個檔案內會有六萬組文字(也就是六萬列),每列又有150個文字(150個ATGC)
: 所以造成檔案容量很大
: 況且我有一百個這樣的檔案要處理, 所以手動切成小檔案的方式不可行
: 當我使用textscan時會造成當機
: 不知道大家當遇到大量文字檔案時有什麼好的處理方式呢?
: 麻煩大家給點建議了謝謝
如果這是個規律的文件檔
建議您試試 fgetl,一次讀進一行文字
進行完轉換後再讀下一行文字
只要寫一個迴圈就可以讀完六萬行
而且不花上幾秒
(我用這個方法來讀simulation的輸出檔,也是動輒5-6萬行)
--
我會假裝你忘了我,假裝你將你我的過往,像候鳥一般從記憶中遷徙
假裝你已走過寒冬迎接春天,我會假裝…一直到自以為一切都是真的!
然後…祝你一生永遠幸福! 《海角七號》
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 68.40.48.222
推
12/26 02:27, , 1F
12/26 02:27, 1F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
MATLAB 近期熱門文章
PTT數位生活區 即時熱門文章