오늘은 맑음

Cuda의 함수 본문

CUDA

Cuda의 함수

자전거 타는 구구 2017. 11. 18. 01:30
반응형
  • cudaMalloc((void**)&dev_M, BufferSize);
    • dev_M에 대한 device memory를 BufferSize만큼 할당

 

  • cudaMalloc((void**)&dev_N, BufferSize);
    • dev_N에 대한 device memory를 BufferSize만큼 할당

 

  • cudaMalloc((void**)&dev_P, BufferSize);
    • dev_P에 대한 device memory를 BufferSize만큼 할당

 

  • cuda에서 제공하는 메모리 복사 함수
    • cudaMemcpy(dev_M, host_M, BufferSize, cudaMemcpyHostToDevice);
      • 만약 마지막 변수가 cudaHostToDevice면 device의 변수인 dev_M을 호스트의 변수인 host_M으로 BufferSize만큼 복사를 한다.
    • cudaMemcpy(host_P, dev_P, BufferSize, cudaMemcpyDeviceToHost);
      • 만약 마지막 변수가 cudaMemcpyDeviceToHost이면 Host의 변수인 host_P를 디바이스의 변수인 dev_P로 BufferSize만큼 복사를 해준다.
  • MatrixMul<<<Dg, Db>>>(M, N, P, size);    
    • __global__함수에 Dg(block), Db(Thread)와 각 변수들을 전달.
    • Dg : dim3 Dg(x, y, dim);  Dg의 변수는 그리드의 x값, y값, dim값을 정한다.
    • Db : dim3 Db(x, y, dim);  Dg의 변수는 블럭의 x값, y값, dim값을 정한다.

 

 

반응형

'CUDA' 카테고리의 다른 글

linux에서 cuda application test  (0) 2019.11.03
CUDA 실행시키기  (0) 2019.02.21
window visual studio15/cuda8.0 설치  (0) 2019.02.21
Comments