게시물 검색

바이오/의료 장에서 직감 : 사람의 마이크로바이옴이 COVID-19의 수수께끼를 푼다.

  • 관리자 (irsglobal1)
  • 2020-06-10 11:43:00
  • hit3815
  • 221.165.209.167

출처 : https://blogs.nvidia.co.jp/2020/06/04/ucsd-microbiome-covid-gpus/

 

마이크로바이옴(microbiome)이란 마이크로바이오타(microbiota)와 게놈(genome)이 합쳐서 만들어진 합성어로, 인간, 동・ 식물, 토양, 바다, 호수, 암벽, 대기 등 모든 환경에서 서식하거나 공존하는 미생물과 그 유전정보 전체를 포함하는 미생물군집이라고 할 수 있다. 최근에는 다양한 환경에서의 미생물군집을 말하기도 한다.

식물마이크로바이옴, 동물마이크로바이옴, 환경마이크로바이옴, 인체마이크로바이옴, 장내마이크로바이옴, 피부마이크로바이옴 등 다양한 마이크로바이옴에 대한 연구들이 보고되고 있다. 이중에서도 인체마이크로바이옴에 대한 연구가 가장 많이 진행되고 있으며, 인체마이크로바이옴 중에서도장내마이크로바이옴에 대한 연구가 가장 활발히 진행되고 있다.(출처 : 생명공학정책연구센터, BioInpro)

 

캘리포니아대학 샌디에이고 캠퍼스의 연구자가 NVIDIA의 GPU에서 미생물 분석을 500배 가속화

 

미국에서 전국적인 록다운이 일어나기 며칠 전, 다니엘 맥도날드(Daniel McDonald)는 자신의 라이프워크가 COVID-19와 싸우기 위한 최적의 도구를 만드는 것임을 깨달았다.

 

맥노날드의 팀이 만든 몇 십만 개의 검사 키트가 질병을 일으키는 신종 코로나를 분석하는 데 도움이 될지도 모른다.

 

맥도날드는 마이크로바이옴 연구라는 새로운 분야에서 아메리칸 것 프로젝트(American Gut Project) 및 마이크로세터 이니시어티브의 과학 디렉터로 일하고 있다. 마이크로바이옴은 단세포생물의 집약체이며, 우리의 내부 및 주위에 있는 대부분의 생물의 생명을 구성하고 있다. 이 검사 키트는 실온에 저장된 사람의 대변에서 샘플을 안전하게 채취하여 보내는 것을, 처음으로 가능하게 하였다.

 

당초 이 키트는 미생물학 분야의 폭넓은 연구를 위한 것이었다. 하지만 맥도날드와 그의 동료들은 이번 팬데믹으로 방향을 전환해야 한다는 사실을 깨달았다.

 

주의 깊이 스크리닝하면 돌연변이를 일으킨 신종 코로나 바이러스가 어떻게 확산되었는지, 샘플을 통해 그 패턴을 알 수 있을지도 모른다. 그것은 새로운 감염의 확산을 억제하려는 공중위생 전문가에게 있어 매우 귀중한 정보이다.

 

맥도날드의 팀은 또한, 참가자들로부터 충분한 데이터를 모아, 연구가자 또 한 가지 수수께끼를 탐구할 수 있게 되기를 바라고 있다. 바로, 신종 코로나로 인해 중증에 이르는 사람이 있는가 하면, 아무런 증상도 나타나지 않는 사람도 있는데, 그 이유가 무엇인가 하는 점이다.

 

캘리포니아대학 샌디에이고 캠퍼스의 롭 나이트(Rob Knight) 연구실에서 50명의 팀원 중 한 명으로서 연구를 하고 있는 맥도날드는, 다음과 같이 말한다.

 

“자신의 활동이 생명을 구하게 될 지도 모른다고 생각하며, 이곳에 있는 모두는 의욕적으로 일한다. RNA나 이 바이러스의 연구에 적용할 수 있는 다양한 분야의 전문가와 밀접하게 연계할 수 있음을, 우리는 행운이라고 생각한다.”

 

 

최적의 타이밍에 액셀러레이터를 투입

 

검사 키트가 어느 정도 형태를 드러내고 있을 때쯤, 팀에게 또 다른 행운이 찾아왔다.

 

샌디에이고 슈퍼컴퓨터 센터의 리드 사이언티픽 소프트웨어 개발자인 이고르 스필리고이(Igor Sfiligoi)가 마이크로바이옴 분석에 사용되는 소프트웨어에서 높은 성능을 필요로 하는 UniFrac의 최신 버전을 NVIDIA GPU로 이식하였다는 사실이다. 그 결과는 엄청났다.

 

서버의 클러스터에서 1,300 CPU 코어 시간(또는 CPU 1기로 약 900시간)을 필요로 하는 11만 3,000건의 샘플의 유전자를 NVIDIA V100 Tensor 코어 GPU 1기가 분석하는 데 2시간도 걸리지 않았다. 이것은 500배나 속도가 빨라진 것이다. V100 GPU를 8기를 사용한 클러스터라면, 15분도 걸리지 않을지도 모른다.

 

또한 이번 이식으로 인해, 연구자 개인이 NVIDIA GeForce RTX 2080 Ti를 탑재한 워크스테이션을 사용하여 9시간 만에 해석할 수 있게 되었다. 또한 작은 데이터세트라면, CPU 1기의 서버로는 13시간이 걸리는 것을, 지금은 NVIDIA GTX 1050 GPU 1기를 탑재한 노트북이면 불과 1시간 정도 만에 실행할 수 있다.

 

“이것은 고성능 컴퓨터에 접근할 수 없는 사람에게 있어 획기적인 일입니다.” 맥도날드는 다음과 같은 예를 들었다. 예를 들어, 개인 연구자가 애드혹 쿼리(ad-hoc query)를 위한 일종의 검색 도구로서 UniFrac을 사용할 수 있을지도 모른다.

 

V100 GPU 6기를 탑재한 연구실의 클러스터라면, 계속해서 증대되는 데이터세트를 분석할 수도 있다.

 

스필리고이에 의한 11만 3,000건의 샘플 분석은, ‘미생물을 조사하는 데 있어서, 아마도 지금까지 중 가장 큰 규모일 것이다’라고, 맥도날드는 말한다. 그럼에도 연구실에는 이미 일반인들이 보낸 30만 명의 샘플이 보관되어 있다. ‘조만간 샘플 수가 100만 개를 넘어설지도 모르겠습니다.’

 

 

GPU에 의한 UniFrac 고속화, 3가지 방법

 

고속화의 열쇠가 된 것은 3가지 기술이었다. OpenACC가 Striped UniFrac 코드 내에서 여러 층에 걸친 루프를 가속화하고, 그런 다음 스필리고이가 메모리를 최적화하였다. 유동소수점 연산을 64비트에서 32비트로 다운시킴으로써, 실험에 필요한 정밀도를 저해해지 않으면서 더욱 속도를 향상시켰다.

 

스필리고이는 최초의 OpenACC에 의한 이식을 불과 며칠 만에 완료하였다. 그 밖의 최적화는 UniFrac에 필요한 계산과 메모리 액세스에 대해 팀이 이해하는 속도에 맞춰 몇 주에 걸쳐 서서히 진행되었다.

 

이 연구가 있기 직전에 스필리고이는 GTC Digital 세션에서 획기적인 성과를 발표했다. 스필리고이와 그의 팀은 천문학 연구를 위해 퍼블릭 클라우드 시스템 상의 GPU로부터 엑사스케일의 성능을 이용하였다.

 

NVIDIA는 스필리고이의 다음 업무에 함께 임한다. 스필리고이의 목표는 UniFrac에 대해 실시한 GPU 최적화를, 미생물학자가 일상적으로 사용하는 소프트웨어와 통합하는 것이다.

 

GPU만 있는 시스템은 데이터의 홍수에 잠식될지도 모른다

 

한편, 맥도날드와 그의 팀은 바이러스 데이터를 취급하기 위해 UniFrac을 개량해야 하는 필요성에 직면하였다. 또한 만들어지게 될 방대한 데이터를 적절하게 정리하여 에러가 일어나지 않는 데이터세트로 변환해야 한다는, 매우 어려운 과제도 해결해야 한다.

 

테크놀로지의 최전선에서, 그들은 수많은 스토리지와 컴퓨팅 성능을 필요로 하고 있다. 언젠가 100만 명에 달하게 될 바이크로바이옴을 해석하려면, 20페타바이트의 스토리지와 연간 1억 회가 넘는 CPU 사이클이 필요하다.

 

“그것이 수많은 GPU에 탑재되는 것을 보고 싶습니다.”라고, 맥도날드는 말한다.

 

다양한 코로나 바이러스에 의해 얼마나 오랜 기간 동안 사람과 가축이 피해를 입어왔는지를 생각하면, 이 연구에는 폭넓은 가능성이 있다고 할 수 있다.

 

“지구상에 있는 모두가 어떤 형태로든 생산성에 대한 이러한 영향을 느껴왔을 것이다. 우리는 지금 오랫동안 공존해온 이 바이러스를, 어떻게 하면 잘 다룰 수 있을지 이해해야만 한다.”

 

샌디에이고에서의 연구는, NVIDIA의 GPU와 고성능 컴퓨팅을 활용하여 COVID-19와 싸우는 연구 프로젝트의 폭넓은 네트워크 중 일부에 지나지 않는다.

 

아시아, 호주, 유럽, 미국에 거점을 둔 전 세계의 30개가 넘는 슈퍼컴퓨팅 센터가 이 활동에 뛰어들고 있다. 그 중에서 COVID-19 고성능 컴퓨팅 컨소시엄만 해도 30개가 넘는 활발하게 활동하는 프로젝트를 갖고 있으며, 41,000기의 GPU를 포함한 420페타플롭스 연산능력에 대한 액세스를 제공하고 있다.

 

관련 도서(1) : 2020 바이오산업 핵심기술-마이크로바이옴 시장동향과 유망기업 및 연구개발 현황

http://www.irsglobal.com/shop_goods/goods_view.htm?category=05000000&goods_idx=83955&goods_bu_id=

 

관련 도서(2) : 마이크로바이옴 국내외 산업동향과 주요 분야별 시장기술분석 및 연구개발 동향

http://www.irsglobal.com/shop_goods/goods_view.htm?category=05000000&goods_idx=83799&goods_bu_id=

 

 
게시글 공유 URL복사
게시물 검색
List of articles
번호 분류 제목 작성자 작성일 조회수
684 에너지/환경 남북 아메리카 CCS 동향 photo 관리자 2022-09-03 hit1079
683 에너지/환경 CCS(이산화탄소 포집ㆍ저장) 상용 프로젝트 동향 photo 관리자 2022-09-03 hit1421
682 ICT/정보통신 ‘우주 인터넷’의 도전, 그 기대와 과제 photo 관리자 2022-08-18 hit1199
681 ICT/정보통신 DX가 일으키는 사회ㆍ산업의 변화와 DX 실현에 필요한 개발 방법 photo 관리자 2022-08-18 hit1231
680 ICT/정보통신 주목해야 하는 15가지 해외 DX 추진 사례 photo 관리자 2022-08-18 hit2335
679 ICT/정보통신 디지털 선진국 덴마크를 통해 배우는 디지털화 전략의 성공 포인트 photo 관리자 2022-08-18 hit1622
678 에너지/환경 가속화되는 차세대 이차전지의 개발과 과제 photo 관리자 2022-08-04 hit1658
677 바이오/의료 합성생물학에 관한 규제와 리스크 어세스먼트 photo 관리자 2022-08-04 hit945
676 바이오/의료 합성생물학 : 인공세포 연구개발 동향 photo 관리자 2022-08-03 hit1774