Re: C++ OpenMP 多CPU同時處理可能的問題

看板Programming作者 (陳揚和)時間15年前 (2010/05/18 02:45), 編輯推噓2(201)
留言3則, 2人參與, 最新討論串2/7 (看更多)
感謝回覆 可是我沒有看懂耶 外面64個迴圈不用OpenMp然後裡面才用?? 然後裡面才用 可以在指點一下嗎? 有人建議我說 說不定一個CPU負責 一部分的counter 可能會比叫快 這樣雖然每個CPU都要把整個array讀一次 但是可能就不用只需要cache 一部分counter 到cache.. ※ 引述《sorryChen (陳揚和)》之銘言: : 我有一個很大的array大概是 3G 個數(其實是Human Genome) : 我想要用多個CPU同時bucket這些數到 64 million個 bucket : 一個簡單的sudo code 大概是這樣 : int array[3G]; : int counters[64M]; : for( int i = 0; i < 3G; i++) { : counter[array[i] % 64M] ++; : } : 如果用openMP平行時 其實只要在for loop 加一行annotation : 但可能會發生剛好兩個CPU同時要算到一個counter會可能出錯 : 但因為有64M個counter 所以剛好算到同一個機會很低 而且其實如果差異不大 : 其實也還可以 : 請問有人有類似的經驗嗎 有人說假設有16個CPU就設16 * 64M個 CPU的counter : 最後在加起來 這個要 4G memory..可能還ok : 另外設semaphore..好像會慢很多 但可能是我設的不好 : 另外就是 假設有衝突 不知道會發生什麼是 就是有counter少加了而以嗎 : 如果只要算個大概就好 可以直接去并行嗎 還是會memory有錯 : 其實錯沒關係 但其實我比較希望多加兒不是少加 有什麼算法或programming上得技巧 : 可以解決這個問題嗎 ※ 引述《sorryChen (陳揚和)》之銘言: : 我有一個很大的array大概是 3G 個數(其實是Human Genome) : 我想要用多個CPU同時bucket這些數到 64 million個 bucket : 一個簡單的sudo code 大概是這樣 : int array[3G]; : int counters[64M]; : for( int i = 0; i < 3G; i++) { : counter[array[i] % 64M] ++; : } : 如果用openMP平行時 其實只要在for loop 加一行annotation : 但可能會發生剛好兩個CPU同時要算到一個counter會可能出錯 : 但因為有64M個counter 所以剛好算到同一個機會很低 而且其實如果差異不大 : 其實也還可以 : 請問有人有類似的經驗嗎 有人說假設有16個CPU就設16 * 64M個 CPU的counter : 最後在加起來 這個要 4G memory..可能還ok : 另外設semaphore..好像會慢很多 但可能是我設的不好 : 另外就是 假設有衝突 不知道會發生什麼是 就是有counter少加了而以嗎 : 如果只要算個大概就好 可以直接去并行嗎 還是會memory有錯 : 其實錯沒關係 但其實我比較希望多加兒不是少加 有什麼算法或programming上得技巧 : 可以解決這個問題嗎 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 24.45.89.98

05/18 03:25, , 1F
我覺得是推文誤解你的意思了...
05/18 03:25, 1F

05/18 23:02, , 2F
外面應是3G/64M個迴圈,不用OpenMP
05/18 23:02, 2F

05/18 23:02, , 3F
裡面的話則是64M 的OpenMP
05/18 23:02, 3F
文章代碼(AID): #1ByOxDAa (Programming)
討論串 (同標題文章)
文章代碼(AID): #1ByOxDAa (Programming)