Re: [問題] CUDA Double precision 矩陣運算有問題

看板C_and_CPP (C/C++)作者 (雉)時間16年前 (2009/11/24 20:08), 編輯推噓1(102)
留言3則, 1人參與, 最新討論串2/2 (看更多)
: 推 holymars:聽起來非常像是硬體問題..你要不要同樣的code換一個平臺 11/24 18:56 : → holymars:或換一張硬體試試看? 11/24 18:56 : → holymars:1.發生的迴圈次數不一定 2.index只有在特定位置會出錯 11/24 18:58 : → holymars:剛好nVidia的第二代硬體架構 是每個陣列24組SP,每個陣 11/24 18:59 : → holymars:列共用8個texture unit.. 11/24 19:01 : 推 holymars:你能不能把所有出問題的index都列出來@@? 11/24 19:13 我把矩陣改成 256*256, gridDim=256, blockDim=256, 計算 A(i,j)=B(i,j) 迴圈重複跑61次之後出現問題(不一定出現在第61迴圈), 有問題的元素共有 52 個 出現問題的 i index 有特定值, 而且是成對出現, j index 看起來則沒特別規律 , e.g. 2, 3, 14, 15, 18, 19, 30, 31 補充: 若跑的陣列大於256, 有問題的 index 則會出現 2+256, 3+256, 14+256 等規律... 底下列出來出現問題的元素 第一項是 A(i,j) 中錯誤的元素 index, 第二項是錯誤的數值, 第三項是正確的數值 第四項是我試著用正確的數值回去搜尋 A(i,j), 找出他跑到哪裡去了 然後會有特定規律, 我已經將他整理過, 沒特別關聯性的會空一行隔開, 列在底下 i=18 j=108 0.610747 0.579428 i=14 j=79 i=19 j=108 0.967197 0.150834 i=15 j=79 i=14 j=79 0.579428 0.051195 i=18 j=12 i=15 j=79 0.150834 0.599082 i=19 j=12 i=18 j=12 0.051195 0.085504 i=14 j=92 i=19 j=12 0.599082 0.332548 i=15 j=92 i=14 j=92 0.085504 0.535536 i=2 j=99 i=15 j=92 0.332548 0.849336 i=3 j=99 i=2 j=99 0.535536 0.24691 i=30 j=35 i=3 j=99 0.849336 0.761968 i=31 j=35 i=30 j=31 0.081968 0.085974 i=30 j=107 i=31 j=31 0.322155 0.269177 i=31 j=107 i=30 j=107 0.085974 0.679649 i=2 j=49 i=31 j=107 0.269177 0.492858 i=3 j=49 i=2 j=49 0.679649 0.107491 i=30 j=112 i=3 j=49 0.492858 0.268076 i=31 j=112 i=30 j=112 0.107491 0.849902 i=2 j=39 i=31 j=112 0.268076 0.416716 i=3 j=39 i=2 j=45 0.160814 0.678987 i=30 j=45 i=3 j=45 0.752666 0.743318 i=31 j=45 i=30 j=58 0.300405 0.020665 i=18 j=84 i=31 j=58 0.25755 0.260123 i=19 j=84 i=30 j=132 0.402535 0.169954 i=18 j=140 i=31 j=132 0.341573 0.827994 i=19 j=140 i=18 j=140 0.169954 0.944015 i=30 j=139 i=19 j=140 0.827994 0.194115 i=31 j=139 i=30 j=139 0.944015 0.388708 i=2 j=147 i=31 j=139 0.194115 0.059594 i=3 j=147 i=2 j=147 0.388708 0.329603 i=30 j=152 i=3 j=147 0.059594 0.295492 i=31 j=152 i=30 j=152 0.329603 0.628385 i=2 j=165 i=31 j=152 0.295492 0.594228 i=3 j=165 i=2 j=165 0.628385 0.511313 i=30 j=176 i=3 j=165 0.594228 0.235191 i=31 j=176 i=30 j=176 0.511313 0.212265 i=18 j=166 i=31 j=176 0.235191 0.454045 i=19 j=166 i=18 j=166 0.212265 0.46702 i=14 j=203 i=19 j=166 0.454045 0.123653 i=15 j=203 i=2 j=184 0.200404 0.575269 i=14 j=204 i=3 j=184 0.18212 0.851387 i=15 j=204 i=14 j=204 0.575269 0.515758 i=2 j=188 i=15 j=204 0.851387 0.487185 i=3 j=188 i=2 j=188 0.515758 0.474857 i=14 j=194 i=3 j=188 0.487185 0.338191 i=15 j=194 i=14 j=194 0.474857 0.825899 i=18 j=189 i=15 j=194 0.338191 0.130394 i=19 j=189 i=14 j=221 0.843913 0.089329 i=18 j=244 i=15 j=221 0.810364 0.972614 i=19 j=244 i=14 j=228 0.195367 0.038529 i=2 j=218 i=15 j=228 0.479673 0.325263 i=3 j=218 i=30 j=247 0.517405 0.998357 i=2 j=246 i=31 j=247 0.279258 0.623962 i=3 j=246 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.123.72.3 ※ 編輯: t19861203 來自: 140.123.72.3 (11/24 20:11)

11/24 22:48, , 1F
我的直覺告訴我是某一組TPC上的Texture unit出問題了
11/24 22:48, 1F

11/24 22:49, , 2F
總之是硬體問題的可能性很大 但是我不確定是在整個
11/24 22:49, 2F

11/24 22:49, , 3F
access的哪一個部份出問題..可能是Texture的L1 cache
11/24 22:49, 3F
文章代碼(AID): #1B2ypMi8 (C_and_CPP)
文章代碼(AID): #1B2ypMi8 (C_and_CPP)