Create a gist now

Instantly share code, notes, and snippets.

@krk /matMul1.cu Secret
Created Jun 27, 2017

What would you like to do?
__global__
void matMul1(
float* d_C,
float* d_A,
float* d_B,
int m,
int n,
int r)
{
int i = blockIdx.x * BLOCK_SIZE + threadIdx.x; // GPU threadinin hesaplayacağı C matrisinin satırı.
int k = blockIdx.y * BLOCK_SIZE + threadIdx.y; // GPU threadinin hesaplayacağı C matrisinin sütunu
int cIdx = i*m + k; // Hesaplanacak elemanın C indisi.
d_C[ cIdx ] = 0;
// C matrisinin her bir hücresi için
for(int j=0; j<n; j++)
{
// her bir eleman için C matrisinin bir elemanı okunur ve yazılır.
d_C[ cIdx ] += *loc( d_A, n, i, j ) * *loc( d_B, r, j, k );
}
}
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment