Create a gist now

Instantly share code, notes, and snippets.

@krk /shared-matmul.cu Secret
Created Jun 27, 2017

What would you like to do?
...
Ais[threadIdx.y][threadIdx.x] = *loc( d_A, n, i, j ); // A(i,j) elemanı Ais paylaşık hafızasına yüklenir.
Bis[threadIdx.y][threadIdx.x] = *loc( d_A, n, j, k ); // A(j,k) elemanı Bis paylaşık hafızasına yüklenir.
// kullanılacak elemanlar paylaşık hafızaya yüklenir.
__syncthreads(); // syncthreads, bloktaki tüm threadlerin bu noktaya erişmesini bekletir.
for(int k=0; k<BLOCK_SIZE;k++)
{
val += Ais[threadIdx.y][k] * Bis[k][threadIdx.x];
}
// tüm threadlerin sonucu yazması beklenir.
__syncthreads(); // syncthreads, bloktaki tüm threadlerin bu noktaya erişmesini bekletir.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment