일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- quantum_computing
- 양자역학의공준
- stl
- HA
- nvidia
- sycl
- jhDNN
- convolution
- CUDA
- FPGA
- cloud
- dnn
- 딥러닝
- CuDNN
- C++
- POD
- Qubit
- flash_memory
- 쿠버네티스
- Compression
- SpMM
- GPU
- deep_learning
- Semiconductor
- jhVM
- DRAM
- kubernetes
- 반도체
- 반도체기초
- 클라우드
- Today
- Total
목록분류 전체보기 (143)
Computing
프로그램 성능 높이기 Sequential 프로그램 실행 성능을 높이기 위해서 다음 같은 2 가지 접근법이 있다. Sequential program optimization : 알고리즘 고도화, 불필요한 코드 제거, 컴파일러를 통한 최적화 등등 Parallelzation : multi-core CPU, GPU, FPGA, multi node system 등을 이용한 계산 병렬처리 일반적으로 프로그램의 성능 향상시키기 위해서는 Sequential 프로그램 최적화를 먼저 진행하고, 목표 성능이 달성되지 않았다면 병렬화를 진행한다. 이때 병렬화 시 미리 어느 정도 성능 향상을 달성할 수 있는 지 예측할 수 있는 2가지 법칙이 있다. 암달의 법칙 (Amdahl's law) 일의 양이 정해졌을 때, 병렬화하면 이 일..
Merge sort 개념 다음 그림과 같이 Two pass (그림 상의 빨간색 과정과 초록색 과정)로 진행됩니다. 빨간색 과정을 Divide path, 초록색 과정을 combine path라고 하겠습니다. [Divide path] Divide path의 경우 Recursively 현재 array를 두개의 연속된 half-arrays로 분할합니다. half-array의 크기가 1이 될때까지 분할합니다. [Combine paht] Combine path의 경우 Recursively 두개의 half-arrays를 합쳐서 하나의 arrays로 정렬합니다. 이때 두 개의 half-arrays는 항상 정렬되어 있기에 두개의 half-arrays를 쉽게 정렬할 수 있습니다. (항상 정렬되어있는 이유는 귀납적으로, h..
개념 도체와 부도체의 중간 정도의 저항률을 가지는 물질로 외부조건에 따라 도체 혹은 절연체에 가까운 성질을 나타낸다고 한다. 구체적으로 다음과 4가지 성질을 가진다고 한다. Resistivity가 0.01 Ω·cm~ 10⁸Ω·cm 정도 전기저항의 온도계수가 음(-)으로 나타남 반도체 물질 내에 불순물 (금속원자)를 첨가할 시 전기저항이 크게 변함 광전효과, 홀효과, 정류작용이 나타남 Energy Band 이론에 따른 분류 Enerygy band 이론에 따르면 반도체는 다음 그림과 같은 band gap을 가진다. 도체는 Valence band (원자가띠, 최외각 전자가 존재)가 Conduction band(전도띠)가 붙어있기에 전자(정공)가 쉽게 이동함 부도체는 Valence band와 Conduction..
이 자료는 김태현 교수님의 양자 컴퓨팅 및 정보의 기초 강의를 바탕으로 정리하였습니다. Postulate 1 The state of the particle is represented by a vector |ψ(t)⟩ in a Hilbert space 입자의 상태는 Hilbert space 상의 vector |ψ(t)⟩ 으로 표현 가능하다. 입자의 상태는 여러 상태의 중첩으로 생각할 수 있다. 다음 예제(Two-level atom)를 생각해보자. 원자에 단 두 개의 에너지 레벨 (ground=0, excited=1)만 있다고 가정하자. 이때 전자의 위치는 |1⟩에 있거나, |0⟩에 있을 수 있다. |0⟩에 있을 확률을 α, |1⟩에 있을 확률을 β라 한다면 전자의 위치 |ψ⟩는 다음과 같이 표현할 수 있다..
Memory (Consistency) Model 이란 A formal specification of how the memory system will appear to the programmer, eliminating the gap between the behavior expected by the programmer and the actual behavior supported by a system.” [Adve’ 1995] Multiple threads program에서 shared data가 어떻게 작동할 지에 대한 명세. Memory consistency model에 따라 (완벽히 squential할 것인가? relaxed한 memory consistency를 허용할 것인가 등) multiple thr..
oneAPI 설치 주의* 현재 Intel oneAPI의 dpcpp은 nvidia gpu를 지원하지 않음 -> 밑의 clang++을 설치하여야 함. SYCL 프로그램 컴파일을 위한 DPC++ compiler 설치 설명 링크: https://www.intel.com/content/www/us/en/develop/documentation/get-started-with-dpcpp-compiler/top.html 다운로드 링크: https://www.intel.com/content/www/us/en/developer/tools/oneapi/base-toolkit.html OS, 다운로드 방식 선택 다운로드 받은 .sh 파일 실행 GUI downloader 설명에 따라 설치 하기 DPC++ compiler 뿐만 아..
[Data Parallel C++: Mastering DPC++ for Programming of Heterogeneous Systems using C++ and SYCL] by James Reinders, Ben Ashbaugh, James Brodman, Michael Kinsner, John Pennycook, Xinmin Tian (Apress, 2020). Chapter 1 : Introduction Advices for building parallel program Chapter 2 : Where Code Executes SYCL: parallel programming framework for heterogeneous processors (CPU, GPU, and FPGA) Chapter 3 ..