Re: [問題] 二進位檔轉ASCII檔
※ 引述《ACupCat (一杯貓)》之銘言:
: 標題: Re: [問題] 二進位檔轉ASCII檔
: 時間: Wed Jan 30 19:28:19 2013
: : 小弟也來野人獻曝一下,
: : 分享自己個人工具庫裡與原PO問題相關的小片段
: : 因為是個人使用的,所以只是針對字串,不是針對檔案
: : 有需要者請自行修改即可
: : # split string/sequences in same size.
: : # ex, strsplit('AABBCCDD',2) -> ['AA','BB','CC','DD']
: : strsplit = lambda seq, size: [seq[i:i+size] for i in range(0, len(seq), size)]
:
: lambda seq, size: map ( ''.join, zip( *([iter(seq)]*size) ) )
:
: : 另外,如果是使用 Mac 或 Unix,
: : 可以在 console 用以下的指令作轉換:
: : xxd -u -ps 100M.bin > 100M.hex
: : 這應該會比自己寫 python 或寫 c 還快 :)
:
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc)
: ◆ From: 218.211.32.194
: 推 yuxio:果然拋磚能引到玉啊, zip 是我不熟悉的函式,等等研究看看 01/30 21:00
: → yuxio:至於拆開再用join組合起來,那是歷史修改的痕跡(羞) 01/30 21:00
: → yuxio:因為最初寫的版本,有檢查如果 x='\x00' 就跳過不轉碼 01/30 21:02
: → yuxio:結果後來這個if又拿掉了...其實就如所述,直接用encode就好 01/30 21:04
: 推 yuxio:去看了zip()的文件也看到 zip(*[iter(s)]*n) 這個 idiom, 01/31 03:32
: → yuxio:可是官方文件卻沒解釋,後來找到這篇 http://goo.gl/kik5I 01/31 03:33
後來想一想, 你的直截了當寫法搞不好其實比較好(快), 做了一下比較, 是真的!
import timeit
from itertools import imap, izip
setup = [ '''
from itertools import imap, izip
f = lambda seq, size: map ( seq.__getitem__, imap ( slice, xrange ( 0, len(seq), size ), xrange ( size, len(seq), size ) ) )
''',
'''
from itertools import imap, izip
f = lambda seq, size: map ( ''.join, izip( *([iter(seq)]*size) ) )
''',
'''
f = lambda seq, size: [seq[i:i+size] for i in xrange(0, len(seq), size)] # yuxio, range -> xrange
''',
'''
f = lambda seq, size: [seq[i:i+size] for i in range(0, len(seq), size)] # yuxio
''' ]
stmt = lambda len_seq, size: 'g = f ( "{0}", {1} )'.format ( 'a'*len_seq, size )
for seq_len in [ 100, 1000, 10000 ]:
for size in xrange ( 2, 10, 2 ):
print map ( "{0:1.3f}".format, [ 100 * timeit.timeit ( stmt = stmt ( seq_len, size ), setup = _setup, number = 100000 / seq_len ) for _setup in setup ] )
for size in xrange ( 20, 100, 20 ):
print map ( "{0:1.3f}".format, [ 100 * timeit.timeit ( stmt = stmt ( seq_len, size ), setup = _setup, number = 100000 / seq_len ) for _setup in setup ] )
結果:
http://ideone.com/siwGHN
你的寫法跑的時間都比較短.
只要把你的code中, range 換成xrange,
就都是最快的!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 219.87.142.18
推
01/31 19:40, , 1F
01/31 19:40, 1F
推
02/01 04:26, , 2F
02/01 04:26, 2F
討論串 (同標題文章)
Python 近期熱門文章
PTT數位生活區 即時熱門文章