황대희 Hwang, Daehee
인간 게놈이 시퀀싱 된 후로 300개 이상의 신체 부위에 대해서 유전체, 단백체, 대사체 데이터들이 생산됨에 따라, 이제 생물학은 인포메이션 사이언스로 변모하고 있다. 이러한 데이터들을 기반으로 의료도 정밀의료란 개념이 등장했다. 예를 들면, 난치성 질환을 가진 치료법이 애매한 환자가 병원에 내원했을 때, 이 환자의 임상정보, 생활습관(식습관, 주거환경, 직업환경 등), 유전체/단백체/대사체 데이터들을 데이터베이스에 있는 환자들 것과 비교해서, 유사한 환자들을 찾고 이들 환자들에서 가장 치료효과가 좋았던 치료법을 찾아내서, 해당 환자에 대한 치료법으로 사용한다. 우리가 먹는 약의 기전을 몰라도 임상시험을 통과했다면 특정 질환이 걸리면 약을 먹듯이, 굳이 왜 이 치료법이 이 환자에게 맞는지 몰라도 된다. 이처럼 데이터는 의생명과학의 패러다임을 변화시키고 있다.
그렇다면 데이터만 있으면 모든 일이 해결될까? 매일 아침 페이스북에 ‘알수도 있는 사람’을 볼 것이다. 이는 왜 이 사람들을 내가 알 수 있을지에 대한 모델은 없다. 단순히 공통적인 지인이 많은 것을 가지고 예측할 뿐이다. 하지만 이중에 내가 싫어하는 사람도 있을 수 있고, 친밀감으로 우선순위(prioritization)를 정해 주지도 않는다. 또한 데이터로부터 룰을 뽑아 낼 때, 자주 나오는 데이터에 편향되게 된다. 내가 쓴 영문이 맞는지 체크할 때, 요즘은 구글에 해당 영문을 서치한 후, 사람들이 많이 사용한다면 문법에 맞다고 판단한다. 하지만 영문법에 맞지 않게 표현을 사람들이 많이 사용하게 되면, 영문법에 틀린 표현이라도 해당 영문이 문법에 맞다고 판단하게 될 것이다. 이것이 빈번도(frequency)와 적합성(relevance)의 문제이다. 정밀의료의 경우도 적합한 데이터를 알맞게 우선순위를 정해야만 올바른 치료법을 찾을 수 있을 것이다.
우리 연구실은 빅데이터로부터 이러한 중요한 정보(주요 조절인자, 생체경로, 메커니즘)을 prioritization하는 것과 다양한 데이터의 종류들(유전체, 단백체, 대사체, 임상정보, 표현형 등)을 통합(data integration)하여 가장 적합한(relevance) 정보(질환 진단/치료 분자 타겟)를 동정하기 위한 시스템생물학적 분석 방법론을 개발하고, 이들을 다양한 난치성 질환에 적용하여 진단/치료 방법을 찾거나 다양한 생명현상에 적용하여 주요 표현형을 설명하는 메커니즘을 예측하는 연구를 한다. 시스템생물학의 3가지 요소는 주어진 생물학적 문제를 풀기 위해, 1) 문제에 관련된 글로벌 데이터를 생산하고, 2) 이들을 생체네트워크로 통합하고, 3) 네트워크를 분석하여 주요 조절인자/생체경로를 동정하는 것이다. 따라서 특정 문제를 풀기 위해 생산되거나, 기존재하는 모든 데이터를 네트워크로 통합하고, 네트워크를 분석하여 prioritization과 relevance한 것을 동시에 할 수 있는 방법론을 개발한다.
지금까지는 특정 문제를 풀기 위해 생산된 글로벌 데이터에 네트워크 분석을 통해서 메커니즘이나 주요 진단/치료 타겟을 찾기 위한 방법론 개발을 많이 해왔다. 요즘은 지금까지 생산된 암관련 모든 양질의 유전체/단백체 데이터를 네트워크로 통합하고 있다. 방대한 빅데이터를 네트워크로 통합하고, 이를 분석하여 유전자/단백질 및 이들의 변이/수식화들 사이의 가장 중요하고 적합한(relevant) 조절관계를 prioritization하는 방법을 개발하고 있다. 구글 또한 막대한 양의 빅데이터를 네트워크로 모델링하여 서치, 연관검색어, 페이지렝킹들을 하고 있다. 폐이스북도 친구관계를 네트워크 모델로 구축하여 ‘알수도 있는사람’, ‘최근 패션/음식 트렌드의 변화’등을 예측하고 있다. 우리도 암관련 분자레벨의 모든 데이터들을 네트워크 모델로 통합하여 구글이나 페이스북에서 하고 있는 적합한 정보를 prioritization을 하는 방법론을 개발하고 있다. 원하는 분자를 이 네트워크 모델에 서치하게 되면, 그 분자와 환자의 예후/생존 입장에서 가장 적합한 조절인자를 우선순위를 정해줄 수 있을 것이다. 이 기술이 개발되면 암이외의 난치성질환들(당뇨, 심혈관질환, 퇴행성뇌질환, 자가면역질환 등)로 네트워크 모델을 확장할 것이다. 이런 네트워크 모델을 기반으로 다양한 질환 시스템에 적용하여 환자의 예후/생존에 관련된 주요 메커니즘을 예측할 수 있고, 이를 바탕으로 난치성 질환들에 대한 정밀의료를 앞당길 수 있기를 기대한다.학력
- - 1990-1996 학사: 포스텍, 화학공학과
- - 1999-2003 박사: MIT, 화학공학과
경력
- - 2006-2013 조/부교수, 포스텍 융합생명과학부/화학공학과
- - 2013-2019 교수, 디지스트 뉴바이올로지
- - 2019-현재 교수, 서울대학교 생명과학부
- D. Mun*, J. Bhin*, S. Kim*, H. Kim*, J.H. Jung*, Y. Jung, Y.E. Jang, J.M. Park, H. Kim, Y. Jung, H. Lee, J. Bae, S. Back, S. Kim, J. Kim, H. Park, H. Li, K. Hwang, Y.S. Park, J.H. Yook, B.S. Kim, S.Y. Kwon, S.W. Ryu, D.Y. Park, T.Y. Jeon, D.H. Kim, J. Lee, S. Han, K.S. Song, D. Park, J.W. Park, H. Rodriguez, J. Kim, H. Lee, K.P. Kim, E.G. Yang#, H.K. Kim#, E. Paek#, S. Lee#, S. Lee#, and D. Hwang#. Proteogenomic characterization of human early onset gastric cancer. Cancer Cell, 6, 6810 (2019).
- M.J. Kwon*, M.H. Han*, J.A. Bagley, D.Y. Hyeon, B.S. Ko, Y.M. Lee, I.J. Cha, S.Y. Kim, D.Y. Kim, H.M. Kim, D. Hwang#, S.B. Lee#, and Y.N. Jan#. Coiled coil structure-dependent interactions between polyQ proteins and Foxo lead to dendrite pathology and behavioral defects. PNAS, 115, E10748-E10757 (2018).
- Y. Kim, J. Jang, S. Choi* and D. Hwang*. TEMPI: Probabilistic modeling Time-Evolving differential PPI net-works with MultiPle Information. Bioinformatics, ECCB spatial edition 30, 17, i453-i460 (2014).
- S. Lee*, J. Lee*, S. Chae*, Y. Moon*, H. Lee, B. Park, E.G. Yang, D. Hwang#, and H. Park#. Multi-dimensional histone methylations for coordinated regulation of gene expression under hypoxia. Nucleic Acids Research, 45,20, 11643-11657(2017)
- K. Boo, J. Bhin, Y. Jeon, J. Kim, H.R. Shin, J. Park, K. Kim, C.Rok. Kim, H. Jang, I. Kim, V.N. Kim, D. Hwang*, H. Lee*, and S.H. Baek*. Pontin functions as an essential coactivator for Oct4-dependent lincRNA expression in mouse embryonic stem cells. Nature Communications, 6, 6810, doi: 10.1038/ncomms7810 (2015).