Re: [問題] 二進位檔轉ASCII檔

看板Python作者 (一杯貓)時間12年前 (2013/01/31 10:59), 編輯推噓2(200)
留言2則, 2人參與, 最新討論串7/7 (看更多)
※ 引述《ACupCat (一杯貓)》之銘言: : 標題: Re: [問題] 二進位檔轉ASCII檔 : 時間: Wed Jan 30 19:28:19 2013 : : 小弟也來野人獻曝一下, : : 分享自己個人工具庫裡與原PO問題相關的小片段 : : 因為是個人使用的,所以只是針對字串,不是針對檔案 : : 有需要者請自行修改即可 : : # split string/sequences in same size. : : # ex, strsplit('AABBCCDD',2) -> ['AA','BB','CC','DD'] : : strsplit = lambda seq, size: [seq[i:i+size] for i in range(0, len(seq), size)] : : lambda seq, size: map ( ''.join, zip( *([iter(seq)]*size) ) ) : : : 另外,如果是使用 Mac 或 Unix, : : 可以在 console 用以下的指令作轉換: : : xxd -u -ps 100M.bin > 100M.hex : : 這應該會比自己寫 python 或寫 c 還快 :) : : -- : ※ 發信站: 批踢踢實業坊(ptt.cc) : ◆ From: 218.211.32.194 : 推 yuxio:果然拋磚能引到玉啊, zip 是我不熟悉的函式,等等研究看看 01/30 21:00 : → yuxio:至於拆開再用join組合起來,那是歷史修改的痕跡(羞) 01/30 21:00 : → yuxio:因為最初寫的版本,有檢查如果 x='\x00' 就跳過不轉碼 01/30 21:02 : → yuxio:結果後來這個if又拿掉了...其實就如所述,直接用encode就好 01/30 21:04 : 推 yuxio:去看了zip()的文件也看到 zip(*[iter(s)]*n) 這個 idiom, 01/31 03:32 : → yuxio:可是官方文件卻沒解釋,後來找到這篇 http://goo.gl/kik5I 01/31 03:33 後來想一想, 你的直截了當寫法搞不好其實比較好(快), 做了一下比較, 是真的! import timeit from itertools import imap, izip setup = [ ''' from itertools import imap, izip f = lambda seq, size: map ( seq.__getitem__, imap ( slice, xrange ( 0, len(seq), size ), xrange ( size, len(seq), size ) ) ) ''', ''' from itertools import imap, izip f = lambda seq, size: map ( ''.join, izip( *([iter(seq)]*size) ) ) ''', ''' f = lambda seq, size: [seq[i:i+size] for i in xrange(0, len(seq), size)] # yuxio, range -> xrange ''', ''' f = lambda seq, size: [seq[i:i+size] for i in range(0, len(seq), size)] # yuxio ''' ] stmt = lambda len_seq, size: 'g = f ( "{0}", {1} )'.format ( 'a'*len_seq, size ) for seq_len in [ 100, 1000, 10000 ]: for size in xrange ( 2, 10, 2 ): print map ( "{0:1.3f}".format, [ 100 * timeit.timeit ( stmt = stmt ( seq_len, size ), setup = _setup, number = 100000 / seq_len ) for _setup in setup ] ) for size in xrange ( 20, 100, 20 ): print map ( "{0:1.3f}".format, [ 100 * timeit.timeit ( stmt = stmt ( seq_len, size ), setup = _setup, number = 100000 / seq_len ) for _setup in setup ] ) 結果: http://ideone.com/siwGHN 你的寫法跑的時間都比較短. 只要把你的code中, range 換成xrange, 就都是最快的! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 219.87.142.18

01/31 19:40, , 1F
認真推!
01/31 19:40, 1F

02/01 04:26, , 2F
推實驗精神! 另我的作法是a=re.findall('.{2}','x'*10000)
02/01 04:26, 2F
文章代碼(AID): #1H2TuKqQ (Python)
文章代碼(AID): #1H2TuKqQ (Python)