마틴 스타이네거

부교수

마틴 스타이네거 Martin Steinegger

마틴 스타이네거
연구분야
생물정보학

우리 연구실은 빅데이터기술과 기계학습 알고리즘을 활용하여, 복잡한 유전체 및 단백질체 분석, 단백질 기능 및 구조 예측, 알려지지 않은 미생물 군집 파악을 위한 새로운 통찰력을 제공합니다. 빠르고 사용하기 쉬운 분석 소프트웨어의 개발을 통해 생명과학 진보에 기여하는 것을 목표합니다. 대표적인 소프트웨어들에는, 단백질 구조분석을 수행하는 AlphaFold2 및 ColabFold, 메타유전체 데이터의 서열 조립(sequence assembly)을 수행하는 Plass, 서열 검색 및 클러스터링을 수행하는 MMseqs2와 Linclust, 단백질 구조 기반 검색을 수행하는 Foldseek이 있습니다. 이들 소프트웨어는 전세계에서 80만 회 넘게 설치되었고, 웹 서비스는 1000만 회 넘게 사용되었습니다. 우리가 제공하는 혁신은 전세계 생명과학 발전의 촉매제로 자리매김하고 있습니다.

학력/경력/수상내역
학력
  • - 2014 - 2018 Ph.D. in Computer Science at the Technical University Munich
  • - 2013 - 2014 Master of Science in Computer Science at the Ludwig Maximilian University
  • - 2010 - 2013 Bachelor of Science in Bioinformatics at TU Munich / Ludwig Maximilian University
경력
  • - since 2024 Associate Professor(tenured), School of Biological Sciences, Seoul National University
  • - 2020 - 2024 Assistant Professor, School of Biological Sciences, Seoul National University
  • - 2018 - 2020 Post-doctoral Researcher, Johns Hopkins University School of Medicine
  • - 2014 - 2018 Research Fellow, Max-Planck Institute for Biophysical Chemistry
주요논문
  1. Barrio-Hernandez, Inigo, Yeo, J.; Jänes, J., Mirdita M., Gilchrist C. L.M., Wein, T., Varadi, M.; Velankar, S., Beltrao, P.*, Steinegger, M.* "Clustering predicted structures at the scale of the known protein universe", Nature, doi: 10.1038/s41586-023-06510-w
  2. van Kempen, M., Kim, S., Tumescheit, C., Mirdita, M., Lee, J., Gilchrist C. L.M., Söding, J.*, and Steinegger, M.* (2023) "Fast and accurate protein structure search with Foldseek", Nature Biotechnology, doi: 10.1101/2022.02.07.479398
  3. Mirdita M.*, Schütze K., Moriwaki Y., Heo L.,Ovchinnikov S.*, and Steinegger M.* (2022), "ColabFold: Making protein folding accessible to all", Nature Methods, doi: 10.1038/s41592-022-01488-1
  4. Elnaggar, A., Heinzinger, M., Dallago, C., and others (2021), "ProtTrans: Towards Cracking the Language of Lifes Code Through Self-Supervised Deep Learning and High Performance Computing", IEEE Transactions on Pattern Analysis and Machine Intelligence, doi: 10.1109/TPAMI.2021.3095381
  5. Jumper J., Evans R., Pritzel A., Green T. and others (2021), "Highly accurate protein structure prediction with AlphaFold", Nature, doi: 10.1038/s41586-021-03819-2
  6. Steinegger, M.*, Salzberg L S. (2020) "Terminating contamination: large-scale search identifies more than 2,000,000 contaminated entries in GenBank", Genome Biology , doi: 10.1186/s13059-020-02023-1 (∗Corresponding author)
  7. Steinegger, M.∗, Milot Mirdita, and Söding, J.∗ (2019) "Protein-level assembly increases protein sequence recovery from metagenomic samples manyfold", Nature Methods, 16, 603–606, doi: 10.1038/s41592-019-0437-4 (∗Corresponding authors)
  8. Steinegger, M.∗, and Söding, J.∗ (2018) "Clustering huge protein sequence sets in linear time" Nature Communications doi: 10.1038/s41467-018-04964-5 (∗Corresponding authors)
  9. Steinegger, M., and Söding, J.* (2017) "MMseqs2: Sensitive protein sequence searching for the analysis of massive data sets", Nature Biotechnology, 35, 1026–1028, doi: 10.1038/nbt.3988