일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 |
- DRAM
- CuDNN
- Compression
- convolution
- dnn
- 양자역학의공준
- 쿠버네티스
- 딥러닝
- sycl
- FPGA
- nvidia
- Semiconductor
- deep_learning
- HA
- 반도체기초
- SpMM
- jhDNN
- kubernetes
- quantum_computing
- 반도체
- jhVM
- POD
- stl
- Qubit
- C++
- CUDA
- 클라우드
- cloud
- GPU
- flash_memory
- Today
- Total
목록전체 글 (142)
Computing
이전글 2022.04.04 - [Parallel Computing/개념] - Collective communication 이전에 collective communication 집합 통신에 대하여 정리한 적이 있었다. 집합 통신은 여러 개의 프로세스(or thread) 간의 데이터를 전송하는 통신 패턴을 의미하는 것으로, 2개의 프로세스간 통신(Point-to-point communication)과 대비되는 개념이다. 오늘은 이 여러 개의 GPU들간의 집합 통신을 구현한 NVIDIA NCCL에 대하여 정리하면서, NCCL의 집합 통신 최적화의 기본 아이디어인 Ring 기반 집합 통신 최적화 방법에 대해서도 정리하고자 한다. Collective Communication 집합 통신 2개의 프로세스간의 통신 패턴..
이전글 2022.03.25 - [Semiconductor/메모리반도체] - RAM 메모리 : DRAM vs SRAM 이전글에서 DRAM(Dynamic Random Access Memory) 반도체와 비교하여 SRAM(Static Random Access Memory) 반도체의 특성에 대하여 정리하였다. DRAM과 SRAM 모두 RAM(Random Access Memory)으로 임의 위치 데이터 접근 시간이 동일하게 소모된다. 또한 둘다 휘발성 반도체로 DRAM과 SRAM 모두 전원이 연결된 상태에서만 자동한다. 오늘은 DRAM에 비해, 빠르지만 저용량인 캐쉬메모리나 레지스터에 적합한 SRAM에 대하여 정리해보고자 한다. 포스텍 강석형 교수님의 강의 시스템 반도체 설계를 바탕으로 정리하였다. SRAM 구조..
https://place.map.kakao.com/2078910428 익선잡방 서울 종로구 수표로28길 17-21 1층 (익선동 166-80) place.map.kakao.com 익선동 데이트때 방문한 브런치카페이다. 건물이 작아 아기자기한 느낌의 맛집이었다. 사진은 얼하산 여친님으로부터 제공받았다.
MPI, OpenMPI MPI(Message Passing Interface, 메세지 전달 인터페이스)는 여러 컴퓨터 간의 정보 교환을 기술하는 표준[1]이다. 여러 컴퓨터를 이용한 분산 및 병렬 처리 시, 컴퓨터간의 데이터 전송의 표준(message-passing library interface specification)이다. 즉 구체적인 프로토콜, 구현이 아닌 어떤 기능들이 제공되어야 하는 지를 나타내는 기술서 정도의 개념이다. MPI는 여러 컴퓨터에서 프로세스(process)들이 실행될 때, 그 프로세스들간의 통신을 위해 사용된다. Fig 1.은 4개의 컴퓨터(노드, node)에서 실행되는 MPI 프로그램 예제를 보여준다. mpirun을 통해 ./myapp 프로그램을 실행하는 4개의 프로세스가 생성..
판교의하루일과 경기 성남시 분당구 분당내곡로 131 2층 11호 (백현동 534) place.map.kakao.com 여자친구와 2300일 기념 방문한 와인바 판교의 하루일과이다. 와인 수입회사인 나라셀라에서 직접 운영하는 와인샵&바 하루일과의 판교점이다. 오늘 와인 한잔의 고급 버전 느낌으로, 위치도 좋고 분위기도 깔끔해 평일 기념일에 퇴근 후 방문하기 좋은 것 같다. 와인 한잔씩도 시킬 수 있지만 식당 옆에 와인이 진열되어있어 와인 한병을 시켰다. 와인 가격은 와인바보다는 저렴하나 샵에서 사는것보다는 조금 비싼 느낌이다. 다만 와인샵에서 와인 구매만 할 시 어느정도 할인해주는 것 같다. (사진 by 여친님)
성수수집 서울 성동구 성수일로1길 10 1층 (성수동1가 656-1872) place.map.kakao.com 여자친구 이직 성공 기념으로 방문한 일식 오마카세 음식점이다. 1부, 2부로 구성되어 있는데, 우리는 1부에 방문하였다. 오마카세 가격이 음식 퀄리티와 서비스 대비 매우 괜찮으며 주류 주문은 필수이다.
에이스크랩 강남직영점 서울 강남구 언주로98길 39-5 1층 (역삼동 704-31) place.map.kakao.com 에이스크랩은 필리핀 세부에 본점을 두고 있는 칠리크랩 맛집이라고 한다. 여자친구와 데이트를 위해 방문하였고, 우리는 칠크세트 M(2인, 47000원)을 먹었다. 칠크세트는 칠리크랩 & 갈릭버터새우 & 갈릭버터 가비리로 구성되어 있는데, 셋 다 맛있었다.
이전 글 2022.06.14 - [Deep Learning/Optimization (Algorithm)] - TensorRT (1) 개념, 최적화 방법, Workflow (Layer Fusion, Quantization 등) 2022.07.08 - [Deep Learning/Optimization (Algorithm)] - TensorRT (2) 설치 및 샘플 테스트 (Ubuntu 18.04 기준) 이전 글들에서 TensorRT의 기본 개념 및 설치 방법에 대하여 알아보았다. 이번 포스터에서는 TensorFlow 딥러닝 네트워크를 TensorRT로 최적화하는 방법에 대하여 정리하고자 한다. TensorFlow의 TensorRT integration 문서[1]를 참고하여 정리하고자 한다. TF-TRT Te..