일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 쿠버네티스
- 클라우드
- sycl
- dnn
- Semiconductor
- jhDNN
- cloud
- Compression
- 반도체기초
- 양자역학의공준
- stl
- CUDA
- 반도체
- quantum_computing
- SpMM
- 딥러닝
- convolution
- C++
- jhVM
- deep_learning
- DRAM
- CuDNN
- GPU
- HA
- FPGA
- Qubit
- nvidia
- kubernetes
- flash_memory
- POD
- Today
- Total
목록분류 전체보기 (143)
Computing
이전글 2022.03.29 - [Deep Learning/Optimization (Algorithm)] - Compression - 1 : Overview 2022.04.29 - [Deep Learning/Optimization (Algorithm)] - Compression - 2 : PyTorch Pruning Tutorial 및 계산 속도가 빨라지지 않는 이유 2022.06.15 - [Deep Learning/Optimization (Algorithm)] - Compression - 3 : Quantization 개념 (1) 지금까지 딥러닝 네트워크의 효율적인 배포를 위한 네트워크 압축(compression) 기술들 및 그 중 quantization 기법에 대하여 정리하였다. 오늘 포스터에서는 qu..
이전글 2022.03.29 - [Deep Learning/Optimization (Algorithm)] - Compression - 1 : Overview 2022.04.29 - [Deep Learning/Optimization (Algorithm)] - Compression - 2 : PyTorch Pruning Tutorial 및 계산 속도가 빨라지지 않는 이유 이전 포스터에서 딥러닝 네트워크 compression에 대한 개념 및 Pruning에 대하여 정리하였다. 이번 포스터에서는 network compression 방법 중 하나인 quantization에 대하여 정리하고자 한다. Quantization의 개념 및 필요성 Quantization(양자화)이라는 단어는 컴퓨터공학 입문 정도의 강의에서 ..
NVIDIA TensorRT는 "A high-performance deep learning inference SDK for production environments" 이다. 즉 실제 딥러닝이 배포되는 환경에서 NVIDIA GPU를 이용해 딥러닝 추론을 가속 & 최적화 할 수 있는 SDK이다. 이번 포스터에서는 빠르고 효율적인 추론만을 위해 설계된 TensorRT에 대해서 정리해보고자 한다. TensorRT가 도입된 배경 및 간략한 소개 딥러닝 네트워크의 정확도 향상을 위해 딥러닝 네트워크가 깊어지고 더 많은 parameters를 가지면서, 네트워크 추론을 위한 연산량은 계속 증가하고 있다. 연산량의 증가는 곧 긴 추론 시간, 많은 메모리 사용, 많은 전력 사용을 의미할 것이다. 음성 인식, 번역, 자율..
이 자료는 KMOOC 신창환 교수님의 강의 [반도 채 몰라도 들을 수 있는 반도체 소자 이야기]를 바탕으로 정리되었습니다. 이전글 2022.05.15 - [Semiconductor/개념] - 반도체 기초 (1) 실리콘 원소와 Charge Carrier 2022.05.19 - [Semiconductor/개념] - 반도체 기초 (2) 실리콘 재료와 에너지 밴드 2022.05.19 - [Semiconductor/개념] - 반도체 기초 (3) Extrinsic Semiconductor (도핑, P형 반도체, N형 반도체) 2022.05.27 - [Semiconductor/개념] - 반도체 기초 (4) Charge Carriers와 Fermi Energy의 관계 2022.06.07 - [Semiconductor/..
이 자료는 KMOOC 신창환 교수님의 강의 [반도 채 몰라도 들을 수 있는 반도체 소자 이야기]를 바탕으로 정리되었습니다. 이전글 2022.05.15 - [Semiconductor/개념] - 반도체 기초 (1) 실리콘 원소와 Charge Carrier 2022.05.19 - [Semiconductor/개념] - 반도체 기초 (2) 실리콘 재료와 에너지 밴드 2022.05.19 - [Semiconductor/개념] - 반도체 기초 (3) Extrinsic Semiconductor (도핑, P형 반도체, N형 반도체) 2022.05.27 - [Semiconductor/개념] - 반도체 기초 (4) Charge Carriers와 Fermi Energy의 관계 지금까지 반도체 내부에서 전하를 이동시키는 char..
이전글 2022.05.24 - [Deep Learning/개념] - Semantic Segmentation (1) : 문제 정의 및 FCN (Fully Convolutional Networks for Semantic Segmentation) 이전글에서 Semantic segmentation란 무엇인지에 대하여 정리하였다. 또한 Semantic segmentation 문제를 풀기 위한 딥러닝 네트워크(SSN)의 도전 과제 및 FCN 네트워크에 대해서도 정리하였다. SSN은 어떤 물체가 있는 지(classification), 어디에 있는 지 (localization)을 one-shot으로 추론하도록 학습된다. Image feature extraction에 강한 convolution 기반의 딥러닝 네트워크(C..
이 포스터는 coursera의 Introduction to OpenCL on FPGA 강좌를 바탕으로 작성되었습니다. Parallel Computing이 필요한 이유 : Single CPU 성능 향상의 벽 Single CPU의 성능이 더욱 좋아질수록 프로그램의 실행 속도는 빨라질 것이다. 하지만 single CPU의 성능을 제한하는 3가지 벽(wall)들이 존재하는데, 바로 다음과 같다. Power wall Intruction-level parallelism wall Memory wall Single CPU의 성능이 증가할수록 CPU가 소모하는 파워가 증가하는데, 그에 따라 CPU의 발열량도 증가한다. 따라서 CPU의 성능이 증가하다 보면 더 이상 일반적인 쿨링 시스템으로는 감당 못하는 발열이 발생하는 ..
이 자료는 KMOOC 신창환 교수님의 강의 [반도 채 몰라도 들을 수 있는 반도체 소자 이야기]를 바탕으로 정리되었습니다. 이전글 2022.05.15 - [Semiconductor/개념] - 반도체 기초 (1) 실리콘 원소와 Charge Carrier 2022.05.19 - [Semiconductor/개념] - 반도체 기초 (2) 실리콘 재료와 에너지 밴드 2022.05.19 - [Semiconductor/개념] - 반도체 기초 (3) Extrinsic Semiconductor (도핑, P형 반도체, N형 반도체) 자유전자의 개수 이전강의 에서 intrinsic semiconductor에서의 자유전자와 정공의 개수에 대하여 구하였다. Semiconductor에서 자유전자의 개수는 Eq 1.과 같이 con..