Computer System Architecture Lab
Computer System Architecture Lab
Home
News
Members
Publications
Research
Gallery
Contact
Light
Dark
Automatic
10
An Efficient Row Buffer Policy Based on Per-Row Activation Counts
An important role of the memory controller is deciding whether to keep a DRAM row open or close it after each access. Conventional …
Wonjae Choi
,
Gunjae Koo
PDF
Cite
Project
Poster
Communication Optimizations on Large-Scale GPU Clusters Using Rail Optimized Networks and NCCL PXN
대규모 언어모델을 효율적으로 수행하기 위해서는 여러 대의 GPU 와 CPU 간의 네트워크 통신 최적화가 필요하다. 본 논문에서는 기존의 네트워크 토폴로지 기반 클러스터 구성의 비효율성을 개선하기 위하여 대규모 GPU 클러스터 환경에서 Rail …
Seha Lee
,
Hongil Shin
,
Gunjae Koo
PDF
Cite
Project
Poster
Performance Analysis of a Per-Row Activation Counting Mechanism in DRAM
In this study we evaluate the performance overhead of per-row activation counting (PRAC) mechanism employed in DDR5 DRAM. PRAC is …
Seongpil Yang
,
Taewoon Kang
,
Gunjae Koo
PDF
Cite
Project
Slides
Slide Show
Cache Side-Channel Attacks Exploiting RoCC Interface on RISC-V SoC Platform
System-on-Chip(SoC)은 많은 종류의 서드파티 IP를 활용하여 설계가 되고 있다. 서드파티 IP의 보안을 내부적으로 검증하는 것은 쉽지 않기 때문에 악의적인 공급자에 의한 하드웨어 트로이목마 …
Yewon Hwang
,
Taeweon Suh
,
Gunjae Koo
PDF
Cite
Project
Slides
Slide Show
Performance Analysis of GEMV Kernels by GPU and PIM Memory Address Mapping Approaches
Processing-in-Memory(PIM)은 프로세서와 오프칩(off-chip) …
Jiwon Shin
,
Gunjae Koo
PDF
Cite
Project
Slides
Slide Show
Performance Analysis of Embedding Cache Models for Optimizing Data Movement in Recommendation Systems
딥러닝 기반 추천 시스템은 심층신경망(DNN) 레이어와 임베딩 레이어로 이루어져 있다. 임베딩 레이어는 범주형 입력값을 이에 대응하는 임베딩 벡터로 변환하는 연산을 수행하며, 임베딩 레이어의 임베딩 테이블 크기는 점진적으로 증가하여 최근에는 …
Hyunwoo Moon
,
Gunjae Koo
PDF
Cite
Project
Poster
Performance Analysis of the Modern Genome Alignment Application
차세대 시퀀싱 기술의 개발로 유전체 데이터 크기가 매우 빠르게 증가하고 있다. 이에 따라 염기 서열 정렬이 새로운 빅데이터 워크로드로서 소프트웨어, 하드웨어적 가속 연구가 활발히 진행되고 있다. 본 연구에서는 이전의 매핑 프로그램보다 최소 2 …
Boyoung Park
,
Gunjae Koo
PDF
Cite
Project
Slides
Slide Show
Performance Analysis of Graph Convolutional Networks on Accelerator Architectures
Graph neural networks의 연산 과정은 높은 희소성을 갖는 행렬 연산을 포함하고 있다. 그러므로, GNN …
Hunjong Lee
,
Gunjae Koo
PDF
Cite
Project
Slides
Slide Show
Analyzing Characteristics of Memory Timing Side-Channels in GPU
최근 연구에서 GPU에서 수행하는 AES와 RSA와 같은 암호 알고리즘에서 GPU의 고유한 메모리 접합 구조에 따른 메모리 접근 시간의 차이를 이용하여 공격자가 암호키를 복원할 수 있음이 밝혀졌다. 이는 GPU 캐시 구조 및 메모리 접합 방식 …
Seungho Jung
,
Myung Kuk Yoon
,
Gunjae Koo
PDF
Cite
Project
Project
Slides
Slide Show
Analyzing Data Cache Performance of Modern GPU Architecture
Graphics processing unit (GPU)는 그래픽 어플리케이션의 처리 뿐만 아니라 최근 machine learning, big data analytics 등의 대규모 병렬처리를 요구하는 어플리케이션의 처리에 널리 사용되고 있다. …
Jonghyun Jeong
,
Yunho Oh
,
Gunjae Koo
PDF
Cite
Project
Slides
Slide Show
»
Cite
×