일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- nvidia
- Compression
- POD
- sycl
- 반도체
- CuDNN
- dnn
- C++
- quantum_computing
- HA
- jhVM
- 클라우드
- GPU
- Semiconductor
- jhDNN
- FPGA
- flash_memory
- SpMM
- convolution
- CUDA
- cloud
- 딥러닝
- Qubit
- 반도체기초
- DRAM
- 쿠버네티스
- kubernetes
- stl
- deep_learning
- 양자역학의공준
Archives
- Today
- Total
목록Example (1)
Computing
cuBLAS MatMul Tutorial
cuBLAS 소개 cuBLAS[1]는 NVIDIA CUDA runtime에서 돌아가는 BLAS를 구현한 library이다. BLAS는 Basic Linear Algebra Subprograms의 약자로 일반적으로 많이 사용되는 선형 대수의 식을 정리한 스펙(speification)[2]이다. Vector-vector 연산, Matrix-vector 연산 Matrix-matrix 연산 등의 많이 사용되는 선형 대수를 표준화한 것으로 입출력과 루틴을 정의해놓았다. BLAS 스펙을 구현한 예로는 cuBLAS(NVIDIA), Intel MKL(Intel), clBLAS(Open source), OpenBLAS(Open source) 등이 있는데, 선형 대수는 많은 애플리케이션에서 사용되기에 많은 accelera..
가속기 Accelerator/GPU
2022. 3. 28. 23:27