딥러닝으로 대표되는 인공지능은 비약적인 발전을 거듭하며, 의생명과학 분야의 연구에서도 활발히 적용되고 있다. 딥러닝의 한 종류인convolutional neural network (CNN)은 이미지 형태의 복잡한 데이터에서 유용한 정보를 추출하는데 적합하여 RNA-Binding Protein의 결합 위치를 정확하게 찾거나, 암-유발 돌연변이를 검출하는 등 고전적 방식으로 풀기 어려운 문제들을 해결하고 있다. 본 연구실에서는 딥러닝에 필수적인 고성능 GPU 서버를 활용하여, RNA 생물학과 암을 포함한 질병 유전체학 분야의 여러 난제들을 풀기 위해 노력하고 있다.
(https://en.wikipedia.org/wiki/Convolutional_neural_network)
Deep Learning for RNA biology
microRNA(miRNA)가 target mRNA를 인식하고, 그 발현을 억제하는 기작을 miRNA targeting이라 부르는데, 인간 유전자 거의 대부분이 miRNA targeting에 의해 직접적으로 제어된다. 따라서, miRNA에 의한 target mRNA의 저해 정도를 예측하는 miRNA target prediction은 세포 내 유전자 조절 네트워크를 이해하고, miRNA 및 siRNA 기반의 의약품을 개발하는데 매우 중요하다. 본 연구실은 miRNA targeting의 포괄적인 규칙을 세계최초로 규명한 바 있다(Kim et al., 2016). 하지만, 아직 다 밝혀지지 않은 다수의 생물학적 인자들이 miRNA targeting에 영향을 미치고 있기 때문에, 이들을 규명해 miRNA target prediction에 반영하는 일은 RNA biology 분야의 난제로 남아있다. 이에 본 연구실에서는 딥 러닝을 활용하여 miRNA targeting에 영향을 미치는 생물학적 인자들을 규명하고, 이를 통해 높은 정확도로 miRNA target을 예측하는 알고리즘을 개발하고 있다.
(Illustrated by Doyeon Kim)
Deep Learning for Disease Genomics
암을 비롯한 다양한 질병의 유전체에서 질병-특이적으로 발생하는 mutation을 동정해내는 작업은 disease-driving mutation 발굴, 질병 유발 메커니즘 규명, 진단 및 치료에 있어 핵심적인 역할을 한다. Next-generation sequencing(NGS) 기술의 눈부신 발달로 거대규모 질병 유전체 데이터가 생산되고 있지만, sequencing 과정에서의 error나 조직 채취 과정의 contamination 등 다양한 원인들로 인해 mutation을 정확히 동정하는 일은 아직도 난제로 남겨져 있다. 본 연구실에서는 환자의 whole genome sequencing 데이터에서 얻어진 여러 context들을 통합적으로 고려하여 mutation을 정확하게 검출해내는 딥러닝 모델을 개발하기 위해 연구하고 있다.
(Illustrated by Minwoo Jeong)