연구실 개요
Next Generation Sequencing(NGS)은 기존의 Sanger DNA sequencing을 획기적으로 뛰어 넘는 기술로, 대용량의 DNA sequencing data를 R&D 분야와 산업계에서 사용할 수 있게 해주었습니다. 아마도 1980년대 후반에 발명된 PCR 이후에, 생명과학과 의학의 paradigm을 바꿀 수 있는 가장 큰 기술적인 혁신이라고 생각됩니다. 하지만 PCR과 달리, NGS의 적용에서는 big data를 분석해낼 수 있는 IT 기술, 즉 Bioinformatics의 도움이 절대적으로 필요합니다. 대규모 NGS 자료를 분석해서 생명과학 및 의학적으로 의미를 찾기 위해서는 Database, Algorithm, Statistics, High performance computing, Artificial intelligence 등 다양한 IT 기술뿐만 아니라, Molecular biology, Bio Ontology, Metabolic pathway, Taxonomy, Phylogenetics, Biological network 등 생물학적 지식도 갖추어야 합니다. 한쪽에 치우친 지식을 가지게 되면, 결국 누군가의 보조 역할 밖에는 할 수 없을 겁니다. 본 연구실에서는 그 동안 인간이 해결하지 못 했던 중요한 생물학적, 의학적 문제를 찾고, 이를 스스로 해결할 수 있는 생물정보학자(Bioinformatician)을 키우는 데 중점을 두고 있습니다.
본 연구실에서는 다양한 형태의 NGS data를 생산하고, GenBank의 기탁돼 있는 천문학적 규모의 DNA sequence data를 활용하여, 지금까지 인간이 한번도 답을 얻지 못 했던 어려운 생물학적, 의학적 질문들에 대한 해답을 얻고자 합니다. 특히 연구실에서 만들어진 다양한 연구 성과가 단순히 논문으로만 끝나지 않고, 전세계 연구자가 지속적으로 사용할 수 있는 Database나 Software 형태로 만드는 것은 Bioinformatics가 다른 분야와 차별화되는 점이며, 본 연구실의 목표이기도 합니다. 누군가가 내가 만든 소프트웨어로 사람을 살리는 연구를 한다면 정말 보람되는 일이겠지요. 물론 이렇게 되려면, 전세계의 수많은 실력 있는 다른 연구실과 경쟁을 해야 하고, 거기서 살아 남아야 그런 목표 달성이 가능하겠지요.
세부 연구 분야
1. Microbial diversity and evolution
미생물은 30억년 이상 꾸준히 진화하여, 현재의 유전적 다양성을 갖추었으나, 인간이 이 점을 이해하기 시작한 것은 바로 NGS 덕분입니다. 지금도 우리가 아는 미생물 다양성은 자연이 가지고 있는 것의 아주 일부에 불과합니다. 이미 전세계연구자들은 많은 데이터를 쌓고 있지만, 아직은 이걸 종합해서 큰 그림 (Big picture)를 보고 있지 못 합니다. 본 연구실의 목표는 바로 이 문제를 해결하는 것입니다. 미생물 분류 동정을 위한 Database 구축: 본 연구실에서 개발한 EzTaxon database는 전세계 연구자들이 세균의 동정과 분류 연구에 사용하는 표준 데이터베이스가 되었습니다. 2007년부터 지금까지 2,000회 이상 인용(분야 상위 0.01%; 중앙일보 기사) 이 되었으며, Database를 발표한 논문은 최근 10년간 한국에서 발표된 논문 중 분야에서 가장 많이 인용된 것으로 보고 되었습니다. 현재 운영중인 Database는 세균용이어서, 곰팡이와 다른 분류군으로 프로젝트의 영역을 넓히고 있습니다. 이 작업은 생물학과 IT를 두루 잘 알아야 가능한 작업입니다. 또한 전세계의 미생물 다양성 및 분포에 대한 Database도 개발하고 있습니다. 이 연구를 통해 역사상 처음으로 Global scale microbialdiversity를 이해할 수 있을 것으로 기대하고 있습니다.
- 미생물 진화 메커니즘 규명: 2009년에 발표한 본 연구실의 연구결과에 따르면 (Chun et al. 2009; PNAS), 세균의 진화는 돌연변이의 발생뿐만 아니라, 개체 사이에 유전자나 유전자 군(gene cluster)을 주고 받는 Lateral gene transfer (LGT)에 의해 일어 난다고 알려져 있습니다. 이 때문에 지난 백 년간 나름대로 사용되어 왔던 세균의 종의 개념 (Species concept)도 다시 정립할 필요가 있습니다. 물론 이 작업은 수만 개의 genome data를 비교하는 comparative genomics 연구를 통해서 가능합니다. 이 작업은 대규모 Database의 구축, 적정 알고리즘의 개발, 수백 년이 걸릴지도 모르는 Computation을 향상시키는 다양한 IT 기술의 적용, 등이 포함됩니다. 이와 함께, 최근에 문제가 되고 있는 항생제 내성의 전파 패턴, 메커니즘 등에 대한 연구도 병행되고 있습니다.
2. Cancer genomics
Cancer genomics: 암은 돌연변이의 의해 발생하는 유전질환으로 진행되면서 다양한 돌연변이가 일어 나므로, Sequencing을 통한 연구가 매우 어렵습니다. Data안에 암세포와 정상세포가 섞여 있고, 한 시료의 암세포들도 그 유전적 다양성이 매우 다양합니다. 본 연구실에서는 새로운 Database, Algorithm의 개발을 통해서, 암의 진단과 치료에 기여할 수 있는 Bioinformatics 기술을 개발하고 있습니다. 이를 위해서 RNA-Seq, Exome, Whole genome sequencing data를 분석하기 위한 다양한 연구를 진행하고 있습니다.
대학원 입학 안내
본 연구실에서는 생물학을 학부에서 전공한 학생뿐만 아니라, 컴퓨터 공학을 전공한 학생들도 참여하여 공부하고 있습니다. Bioinformatics를 전공하기 위해서는 생물학과 컴퓨터 공학을 모두 섭렵해야 하므로, 학부에서 한쪽에 치우친 학생들은 대학원 입학 전에 다른 분야에 대한 공부를 충분히 하는 것이 매우 중요합니다. 가장 이상적인 적은 두 분야를 복수 전공을 하는 것이겠지만, 이것이 여의치 않다면, 빠른 시일에 부족한 공부를 시작 하시기를 권합니다. 생물학을 전공한 학생들은 최소한 Linux, Computer language (본 연구실은 JAVA를 기본적으로 사용합니다), Database, 통계학 분야를 공부해야 하고, 컴퓨터 공학을 전공한 학생들은 General biology와 Molecular biology를 공부할 것을 권합니다. 본 연구실에서는 대학원 입학을 원하는 학생들에게 인턴쉽을 제공하고 있습니다. 서울대 학생들은 수업의 형태로 인턴을 할 수 있으며, 서울대 이외의 학생들에게도 인턴쉽의 기회가 있습니다. 본 연구실에 지원하고자 하는 사람은 강한 motivation, 학문적인 호기심, 그리고 시작한 일을 꼭 이루어 내겠다는 성실성이 요구됩니다. 제 연구실에 관심이 있는 분은 성적표, 자기 소개서를 작성해서 jchun@snu.ac.kr 로 이메일을 주시기 바랍니다.
