討論串(共3篇) - [問題] 使用CUDA Share memory執行"點乘"比glo … - 看板C_and_CPP

看板 [ C_and_CPP ]

討論串[問題] 使用CUDA Share memory執行"點乘"比glo …

共 3 篇文章

排序：最新先 | 最舊先 | 留言數 | 推文總分

內容預覽：開啟 | 關閉 | 只限未讀

首頁

尾頁

Re: [問題] 使用CUDA Share memory執行"點乘"比glo …

推噓1(1推 )留言2則，0人參與作者lgen7604時間16年前 (2010/03/18 03:11)資訊

內容預覽:

我還是再提醒一次. 寫CUDA的時候一定要盡可能的想清楚. 每個block和每個thread該如何處理分配到的工作. 我希望你注意的地方有兩個. 第一個是我和你寫法不同的shared memory的點乘. 你的想法和我的想法有什麼區別?. 第二個是CUDA的計時方式. 如果善用CUDA的Event.

(還有3525個字)

Re: [問題] 使用CUDA Share memory執行"點乘"比glo …

推噓6(6推 )留言16則，0人參與作者lgen7604時間16年前 (2010/03/18 02:38)資訊

內容預覽:

主要是你寫的 Matrix_Point_Multiplication_SM 有問題. 你用for loop的功能是為了什麼?. 能夠只執行一次的動作應該不需要重複執行好幾次吧. 我把 Matrix_Point_Multiplication_SM 改成如下. 呼叫的時候用. Matrix_Point_

(還有710個字)

[問題] 使用CUDA Share memory執行"點乘"比glo …

推噓3(3推 )留言7則，0人參與作者aada (aada)時間16年前 (2010/03/17 23:49)資訊

內容預覽:

請問一下,. 我想使用Share memory來執行點乘,. 但我測出來, 竟然是使用global memory比較快,. 請問為什麼呢?是我的share memory寫錯了嗎. 是因為矩陣點乘的重覆率不高嗎(一點對一點乘,並沒有重複). 以下是我的kernel function. #include

(還有3414個字)

首頁

尾頁