[問題] 如何刪除檔案中不需要的字串?

看板Perl作者 (每天保持微笑)時間16年前 (2009/04/30 04:41), 編輯推噓6(605)
留言11則, 6人參與, 最新討論串1/1
我讀檔一個檔案a.txt,內容如下: NM_000014 2 A2M 9606 GACCCCCGGGGTTGGG NM_000030 189 AGXT 9606 CCUGCCCACUGGC... ....(數行...) 以下資料都是 NM_XXXXXX \t 數字 \t 字母+數字 \t 9606 \t 字母 我想要將紅色區塊都刪除... 但是有顏色標示的除了9606是固定的以外,剩下的藍色、紅色字數都不固定,但間隔都是 利用一個tab間隔,請問有辦法將資料變成: NM_000014 9606 GACCCCCGGGGTTGGG... NM_000030 9606 CCUGCCCACUGGC... ....(數行...) 有爬版...但還是不瞭解該怎麼使用,感謝您的回答<_ _> -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.146.203.213

04/30 05:50, , 1F
perl -F'\t' -nae 'print join "\t", @F[0,3,4]' a.txt
04/30 05:50, 1F

04/30 10:32, , 2F
awk -F"\t" '{printf $1 "\t" $4 "\t" $5 "\n"}' file
04/30 10:32, 2F

05/02 22:51, , 3F
用split應該可以吧....
05/02 22:51, 3F

05/04 20:51, , 4F
好像生物資訊都用perl來處理字串@@
05/04 20:51, 4F

05/05 13:10, , 5F
因為真的...很方便= =/
05/05 13:10, 5F

05/05 16:05, , 6F
這個用split 丟進陣列,或是用regular expression。
05/05 16:05, 6F

05/05 16:05, , 7F
建議你先試著用後者,雖然比前者麻煩,但一旦學會..
05/05 16:05, 7F

05/05 16:06, , 8F
你字串的處理就全部出師了
05/05 16:06, 8F

05/05 17:31, , 9F
我只能推樓上了 XD
05/05 17:31, 9F

05/09 00:39, , 10F
是,生物資訊的話你還可以使用 BioPerl
05/09 00:39, 10F

05/09 19:43, , 11F
喔喔...這倒是第一次聽到,感謝樓上回覆:)
05/09 19:43, 11F
文章代碼(AID): #19-BjhfE (Perl)
文章代碼(AID): #19-BjhfE (Perl)