Performance Analysis of the Modern Genome Alignment Application

Abstract

차세대 시퀀싱 기술의 개발로 유전체 데이터 크기가 매우 빠르게 증가하고 있다. 이에 따라 염기 서열 정렬이 새로운 빅데이터 워크로드로서 소프트웨어, 하드웨어적 가속 연구가 활발히 진행되고 있다. 본 연구에서는 이전의 매핑 프로그램보다 최소 2배 이상 빠른 Minimap2 프로그램을 분석했다. 그 결과, 병렬 처리 성능이 쓰레드 수에 비례할 정도로 효과적이나 메모리 데이터 베이스 공간의 한계로 메모리 용량이 충분하지 않을 때 최대 92.2배로 I/O 접근이 크게 늘어남을 확인했다. 그러므로 처리량 향상을 위해 개선된 시스템에서는 메모리가 부족하지 않게 수백 GB의 유전체 데이터를 관리할 수 있어야한다.

Publication
Korea Software Congress
Boyoung Park
Boyoung Park
PhD Student
Gunjae Koo
Gunjae Koo
Associate Professor