반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- makefile
- 컨벌루션 연산
- Pyverilog 튜토리얼
- CDC
- 클럭 게이팅
- CLOCK GATING
- Data HAzard
- 이진수 곱셈 알고리즘
- 남산업힐
- 딥러닝 가속기
- linux makefile 작성
- AMBA
- Pyverilog 설치
- linux c++ 컴파일
- gcc 컴파일
- 데이터 해저드
- DNN Accelerator
- DNN 가속기
- Design DNN Accelerator
- pytest-pythonpath 설치 오류
- pygraphviz 설치 오류
- Pyverilog 실행
- CUDA
- linux c 컴파일
- systolic array
- 대구 반도체 설계기업 특화
- Makefile compile
- gpgpu-sim
- pyverilog 설치 오류
- Pyvrilog tutorial
Archives
- Today
- Total
오늘은 맑음
Cuda의 함수 본문
반응형
- cudaMalloc((void**)&dev_M, BufferSize);
- dev_M에 대한 device memory를 BufferSize만큼 할당
- cudaMalloc((void**)&dev_N, BufferSize);
- dev_N에 대한 device memory를 BufferSize만큼 할당
- cudaMalloc((void**)&dev_P, BufferSize);
- dev_P에 대한 device memory를 BufferSize만큼 할당
- cuda에서 제공하는 메모리 복사 함수
- cudaMemcpy(dev_M, host_M, BufferSize, cudaMemcpyHostToDevice);
- 만약 마지막 변수가 cudaHostToDevice면 device의 변수인 dev_M을 호스트의 변수인 host_M으로 BufferSize만큼 복사를 한다.
- cudaMemcpy(host_P, dev_P, BufferSize, cudaMemcpyDeviceToHost);
- 만약 마지막 변수가 cudaMemcpyDeviceToHost이면 Host의 변수인 host_P를 디바이스의 변수인 dev_P로 BufferSize만큼 복사를 해준다.
- MatrixMul<<<Dg, Db>>>(M, N, P, size);
- __global__함수에 Dg(block), Db(Thread)와 각 변수들을 전달.
- Dg : dim3 Dg(x, y, dim); Dg의 변수는 그리드의 x값, y값, dim값을 정한다.
- Db : dim3 Db(x, y, dim); Dg의 변수는 블럭의 x값, y값, dim값을 정한다.
반응형
'CUDA' 카테고리의 다른 글
linux에서 cuda application test (0) | 2019.11.03 |
---|---|
CUDA 실행시키기 (0) | 2019.02.21 |
window visual studio15/cuda8.0 설치 (0) | 2019.02.21 |
Comments