반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- Design DNN Accelerator
- systolic array
- Pyverilog 튜토리얼
- 컨벌루션 연산
- CLOCK GATING
- 대구 반도체 설계기업 특화
- CDC
- Pyverilog 실행
- 딥러닝 가속기
- AMBA
- 데이터 해저드
- Pyverilog 설치
- linux c++ 컴파일
- pyverilog 설치 오류
- pytest-pythonpath 설치 오류
- DNN Accelerator
- 남산업힐
- Data HAzard
- makefile
- linux makefile 작성
- Makefile compile
- gpgpu-sim
- DNN 가속기
- pygraphviz 설치 오류
- Pyvrilog tutorial
- linux c 컴파일
- CUDA
- 이진수 곱셈 알고리즘
- gcc 컴파일
- 클럭 게이팅
Archives
- Today
- Total
목록systolic array convolution (1)
오늘은 맑음

안녕하세요, 앞서 systolic array를 활용한 NPU에 대해서 이야기를 했었습니다. 오늘은 systolic array를 간단하게 만들어서 컨벌루션 연산을 해보는 실험을 해보겠습니다. 그림 1의 컨벌루션 연산을 수행해 볼 예정입니다. 좌측의 5x3은 입력 데이터이며, 우측의 3x3은 가중치입니다. 따라서 컨벌루션 연산을 하게 되면 총 3개의 output activation이 나오게 됩니다. 차례대로 연산을 하게 되면 output activation은 각각 312, 348, 384가 나오게 됩니다. 위의 연산을 수행하기 위해서는 총 9개의 mac 연산기를 이용해 작은 systolic array를 만들어보겠습니다. 그림 3과 같이 총 9개의 MAC연산기가 있습니다. 각 MAC 연산기에는 처음 weigh..
NPU
2022. 3. 20. 20:50