일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- kubernetes
- 쿠버네티스
- 딥러닝
- Qubit
- jhVM
- nvidia
- 양자역학의공준
- quantum_computing
- convolution
- 반도체
- SpMM
- CuDNN
- FPGA
- sycl
- deep_learning
- DRAM
- 클라우드
- GPU
- 반도체기초
- Semiconductor
- CUDA
- Compression
- cloud
- C++
- jhDNN
- HA
- POD
- dnn
- flash_memory
- stl
Archives
- Today
- Total
목록tensor_core (1)
Computing
NVIDIA : Tensor core
Tensor core는 NVIDIA GPU volta architecture(2018)부터 등장한 Matrix multiply-accumulate (MMA) 연산을 지원하기 위한 specialized computing unit이다. 다양한 NPU(Google의 Tensor Processing Unit 등)들과 같이, 딥러닝이 대세가 되고 matrix-multiplication이 많은 애플리케이션에서 주요한 성능 병목이 되면서 NVIDIA가 GPU에도 탑재한 것으로 생각된다. 이번 포스트에서는 다음 논문을 읽고 Tensor core에 대하여 정리해보고자 한다. Programmability와 성능, 한계 등에 대하여 매우 자세히 분석해놓은 논문이다. Markidis, Stefano & Chien, Steve..
Deep Learning/Optimization (Hardware)
2022. 3. 11. 22:35