Re: [問題] 加入項目問題

看板Perl作者 (把青春freeze)時間14年前 (2011/06/14 19:32), 編輯推噓2(202)
留言4則, 2人參與, 最新討論串2/4 (看更多)
※ 引述《fuwafuwa (此人已死,有事燒紙)》之銘言: :  (其實不知道怎麼下標題才比較清楚,新手發問請多包涵) :  現在我要處理一些資料,資料型態如下: :  1,2 1,15 1,8 1,17 1,88 1,86 1,158 1,3 1,4........ :  2,81 2,136 2,186 2,182 2,186 2,238 2,91 2,231 2,53 2,60 2,10..... :  3,65 3,16 3,16 3,114 3,59 3,189 3,246 3,96 3,92 3,82 3,231.... :  就是(第幾條,item),資料有六萬多快七萬條 :  想要做成(第幾條,位置,1,item)這樣的形式 :  最後得到的結果如下: :  1,1,1,2 1,2,1,15 1,3,1,8 1,4,1,17 1,5,1,88........... :  2,1,1,81 2,2,1,136 2,3,1,186 2,4,1,182.......... :  3,1,1,65 3,2,1,16 3,3,1,16 3,4,1,114.......... :  目前想到的做法是先把空白替換成換行符號, :  然後針對每一行用split把,前後分開, :  再給一個迴圈,迴圈從1開始到六萬多, :  迴圈裡給一個變數(位置), :  如果序列條數跟迴圈比對成功,位置就加一, :  不成功就位置歸零。 :  程式寫了也可以跑,但是時間花非常多, :  凌晨兩點開始跑,跑到早上十點多才output到第11條的一半。囧 :  所以想請問板上的強者們,我的程式有什麼需要修改的地方? :  我自己也想過一些加速的方法, :  例如把input file寫進陣列裡,比對成功的輸出完後就shift出去, :  比對不成功就不再往下比對(←這邊想破了頭不知道該怎麼寫), :  也不知道這樣的想法是否可行。 :  以下提供我的程式碼,如果有描述不清的地方我可以再補充, :  麻煩大家不吝賜教,謝謝。^^" : == : #(替換工作已做完): : open (OUT, ">>output_file.txt"); : open (FILE, "input_file.txt")||die "$!\n"; : foreach $line(<FILE>) : { : for $i (0..65156) : { : ($cid, $transaction) = split(',', $line); : if ($cid == $i+1) : { : $tid = $tid+1; : print OUT "$cid,$tid,1,$transaction"; : } : else : { : $tid = 0; : } : } : } open (OUT, ">>output_file.txt"); open (FILE, "input_file.txt")||die "$!\n"; foreach $line(<FILE>) { $tid = 0 ; for $element (split/\s+/,$line){ $tid++ ; ($cid,$transcation)=split',',$element ; print "$cid,$tid,1,$transcation " ; } } -- 如果青春注定要向前跑 他媽的...那我的出口在那? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 42.72.59.64

06/14 19:47, , 1F
先謝謝你:) 可是這樣cid=2時tid沒有從1開始算耶^^"
06/14 19:47, 1F

06/14 21:23, , 2F
我不懂你的問題 為什麼要重算?
06/14 21:23, 2F

06/14 21:24, , 3F
我以為只要切開再把你要的東西塞進去就行了
06/14 21:24, 3F

06/14 21:29, , 4F
要重算的原因是要算每一條序列裡有幾個item
06/14 21:29, 4F
文章代碼(AID): #1DzqQvtR (Perl)
討論串 (同標題文章)
本文引述了以下文章的的內容:
以下文章回應了本文
完整討論串 (本文為第 2 之 4 篇):
文章代碼(AID): #1DzqQvtR (Perl)