[問題] CUDA的cudaMallocPitch用法及矩陣相乘

看板C_and_CPP (C/C++)作者 (ROCK N ROLL)時間13年前 (2013/05/18 20:15), 編輯推噓0(003)
留言3則, 2人參與, 最新討論串1/1
開發平台(Platform): VC++ 2008 問題(Question): 不好意思!! 小弟最近在練習矩陣相乘的時候遇到了一些問題,然後再參考了書本及 一些資料之後,發現到可以使用cudaMallocPitch()來解決陣列維度大小不是2的冪次方 的問題,但小弟仍然不太清楚cudaMallocPitch()的用法,請各位前輩給予指點,感謝!! 補充說明(Supplement): 小弟的矩陣大小是動態的,每次大小都不固定,會這樣問的原因是因為如果使用cudaMal loc的話,從device回傳的值都是錯誤的,因此請求大家幫幫忙。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 120.126.40.169

05/19 00:02, , 1F
印象中 3.x版的toolkit好像開始支援printf 或許可以先
05/19 00:02, 1F

05/19 00:04, , 2F
找一下錯誤
05/19 00:04, 2F

05/20 14:18, , 3F
感謝您 已解決 目前是卡在矩陣大小只能是2的冪次方這邊
05/20 14:18, 3F
文章代碼(AID): #1Hbt3Opd (C_and_CPP)
文章代碼(AID): #1Hbt3Opd (C_and_CPP)