Re: [問題] CUDA Double precision 矩陣運算有問題
: 推 holymars:聽起來非常像是硬體問題..你要不要同樣的code換一個平臺 11/24 18:56
: → holymars:或換一張硬體試試看? 11/24 18:56
: → holymars:1.發生的迴圈次數不一定 2.index只有在特定位置會出錯 11/24 18:58
: → holymars:剛好nVidia的第二代硬體架構 是每個陣列24組SP,每個陣 11/24 18:59
: → holymars:列共用8個texture unit.. 11/24 19:01
: 推 holymars:你能不能把所有出問題的index都列出來@@? 11/24 19:13
我把矩陣改成 256*256, gridDim=256, blockDim=256, 計算 A(i,j)=B(i,j)
迴圈重複跑61次之後出現問題(不一定出現在第61迴圈), 有問題的元素共有 52 個
出現問題的 i index 有特定值, 而且是成對出現, j index 看起來則沒特別規律
, e.g. 2, 3, 14, 15, 18, 19, 30, 31
補充: 若跑的陣列大於256, 有問題的 index 則會出現 2+256, 3+256, 14+256 等規律...
底下列出來出現問題的元素
第一項是 A(i,j) 中錯誤的元素 index, 第二項是錯誤的數值, 第三項是正確的數值
第四項是我試著用正確的數值回去搜尋 A(i,j), 找出他跑到哪裡去了
然後會有特定規律, 我已經將他整理過, 沒特別關聯性的會空一行隔開, 列在底下
i=18 j=108 0.610747 0.579428 i=14 j=79
i=19 j=108 0.967197 0.150834 i=15 j=79
i=14 j=79 0.579428 0.051195 i=18 j=12
i=15 j=79 0.150834 0.599082 i=19 j=12
i=18 j=12 0.051195 0.085504 i=14 j=92
i=19 j=12 0.599082 0.332548 i=15 j=92
i=14 j=92 0.085504 0.535536 i=2 j=99
i=15 j=92 0.332548 0.849336 i=3 j=99
i=2 j=99 0.535536 0.24691 i=30 j=35
i=3 j=99 0.849336 0.761968 i=31 j=35
i=30 j=31 0.081968 0.085974 i=30 j=107
i=31 j=31 0.322155 0.269177 i=31 j=107
i=30 j=107 0.085974 0.679649 i=2 j=49
i=31 j=107 0.269177 0.492858 i=3 j=49
i=2 j=49 0.679649 0.107491 i=30 j=112
i=3 j=49 0.492858 0.268076 i=31 j=112
i=30 j=112 0.107491 0.849902 i=2 j=39
i=31 j=112 0.268076 0.416716 i=3 j=39
i=2 j=45 0.160814 0.678987 i=30 j=45
i=3 j=45 0.752666 0.743318 i=31 j=45
i=30 j=58 0.300405 0.020665 i=18 j=84
i=31 j=58 0.25755 0.260123 i=19 j=84
i=30 j=132 0.402535 0.169954 i=18 j=140
i=31 j=132 0.341573 0.827994 i=19 j=140
i=18 j=140 0.169954 0.944015 i=30 j=139
i=19 j=140 0.827994 0.194115 i=31 j=139
i=30 j=139 0.944015 0.388708 i=2 j=147
i=31 j=139 0.194115 0.059594 i=3 j=147
i=2 j=147 0.388708 0.329603 i=30 j=152
i=3 j=147 0.059594 0.295492 i=31 j=152
i=30 j=152 0.329603 0.628385 i=2 j=165
i=31 j=152 0.295492 0.594228 i=3 j=165
i=2 j=165 0.628385 0.511313 i=30 j=176
i=3 j=165 0.594228 0.235191 i=31 j=176
i=30 j=176 0.511313 0.212265 i=18 j=166
i=31 j=176 0.235191 0.454045 i=19 j=166
i=18 j=166 0.212265 0.46702 i=14 j=203
i=19 j=166 0.454045 0.123653 i=15 j=203
i=2 j=184 0.200404 0.575269 i=14 j=204
i=3 j=184 0.18212 0.851387 i=15 j=204
i=14 j=204 0.575269 0.515758 i=2 j=188
i=15 j=204 0.851387 0.487185 i=3 j=188
i=2 j=188 0.515758 0.474857 i=14 j=194
i=3 j=188 0.487185 0.338191 i=15 j=194
i=14 j=194 0.474857 0.825899 i=18 j=189
i=15 j=194 0.338191 0.130394 i=19 j=189
i=14 j=221 0.843913 0.089329 i=18 j=244
i=15 j=221 0.810364 0.972614 i=19 j=244
i=14 j=228 0.195367 0.038529 i=2 j=218
i=15 j=228 0.479673 0.325263 i=3 j=218
i=30 j=247 0.517405 0.998357 i=2 j=246
i=31 j=247 0.279258 0.623962 i=3 j=246
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.123.72.3
※ 編輯: t19861203 來自: 140.123.72.3 (11/24 20:11)
推
11/24 22:48, , 1F
11/24 22:48, 1F
→
11/24 22:49, , 2F
11/24 22:49, 2F
→
11/24 22:49, , 3F
11/24 22:49, 3F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
C_and_CPP 近期熱門文章
PTT數位生活區 即時熱門文章