일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- SpMM
- POD
- 양자역학의공준
- 클라우드
- jhVM
- jhDNN
- nvidia
- convolution
- sycl
- dnn
- 딥러닝
- flash_memory
- C++
- CUDA
- quantum_computing
- 반도체기초
- cloud
- CuDNN
- Qubit
- DRAM
- deep_learning
- kubernetes
- 쿠버네티스
- Compression
- 반도체
- Semiconductor
- GPU
- stl
- FPGA
- HA
Archives
- Today
- Total
목록Graphs (1)
Computing
CUDA Graphs : 개념 설명 및 구현 예제
cuDNN cuDNN 8.0 부터 도입된 cuDNN backend API는 network 생성과 execution을 분리하여 성능상의 이점을 가져온다. 프로그래머는 코드 상에서 미리 deep learning primitives들의 graph(network)를 선언한다. 빌드 과정에서 graph는 최적화되며, 주로 operation fusion을 예로 든다. 컴파일 단계에서 operation(kernel)들을 하나의 operation로 만들어 최적화하는 기법인데 kernel launch overhead를 줄일 수 있을 뿐만 아니라, 불필요한 메모리 I/O도 줄일 수 있다. 이러한 cuDNN backend API는 CUDA Graphs를 기반으로 만들어졌다고 한다. 이번 포스터에서는 [1], [2], [3]..
가속기 Accelerator/GPU
2022. 4. 18. 20:00