일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 |
- deep_learning
- Qubit
- 반도체
- cloud
- POD
- Compression
- SpMM
- dnn
- HA
- jhVM
- FPGA
- 쿠버네티스
- jhDNN
- CUDA
- 반도체기초
- sycl
- nvidia
- Semiconductor
- 딥러닝
- CuDNN
- stl
- quantum_computing
- 양자역학의공준
- C++
- 클라우드
- GPU
- DRAM
- flash_memory
- convolution
- kubernetes
- Today
- Total
목록전체 글 (142)
Computing
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/coIKIC/btrEOG35HUm/mb0conrTmRNl976Lcjnlf1/img.png)
이전글 2022.03.29 - [Deep Learning/Optimization (Algorithm)] - Compression - 1 : Overview 2022.04.29 - [Deep Learning/Optimization (Algorithm)] - Compression - 2 : PyTorch Pruning Tutorial 및 계산 속도가 빨라지지 않는 이유 이전 포스터에서 딥러닝 네트워크 compression에 대한 개념 및 Pruning에 대하여 정리하였다. 이번 포스터에서는 network compression 방법 중 하나인 quantization에 대하여 정리하고자 한다. Quantization의 개념 및 필요성 Quantization(양자화)이라는 단어는 컴퓨터공학 입문 정도의 강의에서 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/btspxu/btrEJ5g1OT8/d69NeN7C2ekH8yHNpwCKdk/img.png)
NVIDIA TensorRT는 "A high-performance deep learning inference SDK for production environments" 이다. 즉 실제 딥러닝이 배포되는 환경에서 NVIDIA GPU를 이용해 딥러닝 추론을 가속 & 최적화 할 수 있는 SDK이다. 이번 포스터에서는 빠르고 효율적인 추론만을 위해 설계된 TensorRT에 대해서 정리해보고자 한다. TensorRT가 도입된 배경 및 간략한 소개 딥러닝 네트워크의 정확도 향상을 위해 딥러닝 네트워크가 깊어지고 더 많은 parameters를 가지면서, 네트워크 추론을 위한 연산량은 계속 증가하고 있다. 연산량의 증가는 곧 긴 추론 시간, 많은 메모리 사용, 많은 전력 사용을 의미할 것이다. 음성 인식, 번역, 자율..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/RMJKl/btrEt1FO4s1/kcuxpfO5QPvikPcs15lzQ1/img.png)
이 자료는 KMOOC 신창환 교수님의 강의 [반도 채 몰라도 들을 수 있는 반도체 소자 이야기]를 바탕으로 정리되었습니다. 이전글 2022.05.15 - [Semiconductor/개념] - 반도체 기초 (1) 실리콘 원소와 Charge Carrier 2022.05.19 - [Semiconductor/개념] - 반도체 기초 (2) 실리콘 재료와 에너지 밴드 2022.05.19 - [Semiconductor/개념] - 반도체 기초 (3) Extrinsic Semiconductor (도핑, P형 반도체, N형 반도체) 2022.05.27 - [Semiconductor/개념] - 반도체 기초 (4) Charge Carriers와 Fermi Energy의 관계 2022.06.07 - [Semiconductor/..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/s2tRU/btrEczwjit4/tEbC1hUuj76UIm52SqLzNk/img.png)
이 자료는 KMOOC 신창환 교수님의 강의 [반도 채 몰라도 들을 수 있는 반도체 소자 이야기]를 바탕으로 정리되었습니다. 이전글 2022.05.15 - [Semiconductor/개념] - 반도체 기초 (1) 실리콘 원소와 Charge Carrier 2022.05.19 - [Semiconductor/개념] - 반도체 기초 (2) 실리콘 재료와 에너지 밴드 2022.05.19 - [Semiconductor/개념] - 반도체 기초 (3) Extrinsic Semiconductor (도핑, P형 반도체, N형 반도체) 2022.05.27 - [Semiconductor/개념] - 반도체 기초 (4) Charge Carriers와 Fermi Energy의 관계 지금까지 반도체 내부에서 전하를 이동시키는 char..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cGFwh2/btrDOw650pc/SLBBYhFIj8PhgsBkkR0E3k/img.png)
이전글 2022.05.24 - [Deep Learning/개념] - Semantic Segmentation (1) : 문제 정의 및 FCN (Fully Convolutional Networks for Semantic Segmentation) 이전글에서 Semantic segmentation란 무엇인지에 대하여 정리하였다. 또한 Semantic segmentation 문제를 풀기 위한 딥러닝 네트워크(SSN)의 도전 과제 및 FCN 네트워크에 대해서도 정리하였다. SSN은 어떤 물체가 있는 지(classification), 어디에 있는 지 (localization)을 one-shot으로 추론하도록 학습된다. Image feature extraction에 강한 convolution 기반의 딥러닝 네트워크(C..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/SMXzj/btrDuwHFfJp/hLEKaYHIfC4GhK7LZMSZqk/img.png)
이 포스터는 coursera의 Introduction to OpenCL on FPGA 강좌를 바탕으로 작성되었습니다. Parallel Computing이 필요한 이유 : Single CPU 성능 향상의 벽 Single CPU의 성능이 더욱 좋아질수록 프로그램의 실행 속도는 빨라질 것이다. 하지만 single CPU의 성능을 제한하는 3가지 벽(wall)들이 존재하는데, 바로 다음과 같다. Power wall Intruction-level parallelism wall Memory wall Single CPU의 성능이 증가할수록 CPU가 소모하는 파워가 증가하는데, 그에 따라 CPU의 발열량도 증가한다. 따라서 CPU의 성능이 증가하다 보면 더 이상 일반적인 쿨링 시스템으로는 감당 못하는 발열이 발생하는 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bfNfBv/btrDexUHtPx/OhwHis4UT7knGWg2sAMQG0/img.png)
이 자료는 KMOOC 신창환 교수님의 강의 [반도 채 몰라도 들을 수 있는 반도체 소자 이야기]를 바탕으로 정리되었습니다. 이전글 2022.05.15 - [Semiconductor/개념] - 반도체 기초 (1) 실리콘 원소와 Charge Carrier 2022.05.19 - [Semiconductor/개념] - 반도체 기초 (2) 실리콘 재료와 에너지 밴드 2022.05.19 - [Semiconductor/개념] - 반도체 기초 (3) Extrinsic Semiconductor (도핑, P형 반도체, N형 반도체) 자유전자의 개수 이전강의 에서 intrinsic semiconductor에서의 자유전자와 정공의 개수에 대하여 구하였다. Semiconductor에서 자유전자의 개수는 Eq 1.과 같이 con..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bmENfW/btrC2h4cI0E/8H9IEb63Nqlid4iKFEzlr0/img.png)
Semantic Segmentation 문제 정의 Semantic의 사전적 의미는 "의미론의"이다. 프로그래밍 언어 및 컴파일러를 배우다보면 syntactic(구문론의)과 더불어 자주 나오는 개념인데, 말 그대로 어떤 것의 "의미"를 의미한다. "나는 쇠를 먹었다"라는 문장은 문법적으로는 틀리지 않았지만 (syntactically correct), 의미는 전혀 말이 되지 않는 문장이다. (사람이 어떻게 쇠를 먹겠는가?) 이처럼 보여지는 형식에서 벗어난 어떤 것의 "의미"를 가리키는 단어가 semantics, semantic이다. 이때 "의미"라는 것은 사람이 정하는 기준에 따라 정해지는 것이다. 따라서 semantic segmentation은 의미에 따라서 영상을 분할하는 문제이다. Fig 1.은 sem..