게시물 검색

바이오/의료 AI 활용이 가속화되는 신약 개발 : 신속한 단백질 구조 해명이 가져오는 효과

  • 관리자 (irsglobal1)
  • 2023-12-27 11:57:00
  • hit2703
  • 118.47.187.187

출처 : https://www.pictet.co.jp/investment-information/fund-insight/fund-watch/bio/Bio-20230922.html 

 

인공지능(AI)을 활용하여 단백질 구조 해명

 

단백질은 세포의 중요한 구성 요소이며, 세포는 생명체의 구성 요소다. 단백질 구조가 어떻게 형성되고 변화하는지 이해하는 것은 생물학을 이해하는 데 있어 중요하며, 신약 개발 속도 향상, 더 강한 곡물 개발, 플라스틱 폐기물의 분해 등을 더 쉽게 만든다.

 

그렇지만 단백질의 구조는 그 구성 요소인 아미노산으로 이루어진 선상 폴리머가 접혀 있는 3차원 구조 형태로 존재하기 때문에, 최근까지 해명하는 데 어려움이 있었다. 단백질의 접힘 구조는 성질이 서로 다른 다양한 아미노산의 상호작용을 최적화하게 하여, 종이가 아니라 사슬 형태의 구슬로 만들어진 종이접기와 같은 형태를 띤다.

 

보스턴에 거점을 둔 제약회사 AI 프로틴(AI Proteins)의 공통 창업자인 크리스 발 박사(Dr. Chris Bahl)실험을 통해 단백질의 구조를 결정하려면 많은 노력과 시간이 필요하다. 그것을 위한 실험은 단백질 구조가 처음으로 해명된 후 반세기 동안 수십만 번 이루어졌을 뿐이다라고 말한다. 십만이 큰 숫자처럼 느껴질 수도 있지만, 단백질 구조가 수억 개라는 걸 생각하면 아주 적은 수에 지나지 않는다. 또한 그것을 해명하려면 여러 해가 걸리는 힘든 작업일 뿐 아니라 X선 결정 구조의 해석 및 저온 전자 현미경 분석 등 비용이 많이 들어가는 기술을 필요로 한다.

 

이러한 상황이 바뀌게 된 것은 (알파벳의 자회사인) 딥마인드(DeepMind)가 정부 간 연구기관인 유럽 분자생물학연구소(European Molecular Biology Laboratory : EMBL)와 연계하여 인공지능 프로그램 알파폴드(AlphaFold)’를 공동으로 개발한 2021년의 일이다. 알파폴드는 AI를 사용하여 사람의 능력을 훨씬 능가하는 속도로 아미노산 배열을 통해 단백질 구조를 예측할 수 있다고, 발 박사는 말한다. 이 툴은 2억 개 이상의 단백질 구조를 예측할 수 있다.

 

2022년에는 페이스북의 모회사인 메타 플랫폼(Meta)이 박테리아, 바이러스, 미생물 등에서 채취되며, 그전까지는 특성을 해명하지 못했던 약 6억 개의 단백질의 형태를 예측하는 데이터베이스를 공개했다. 메타 플랫폼의 방식에서는 ChatGPT가 공개된 후 주목을 받고 있는 대규모 언어 모델(LLM)이 사용된다. LLM은 숫자 또는 숫자를 표현하는 말을 통해 문장을 예측할 수 있는 단백질의 오토 컴플리트(자동 완성)’와 같은 것이라 할 수 있다.

 

LLM과 알파폴드의 가장 큰 차이는 LLM이 인접한 아미노산의 배열 또는 다중 배열 얼라인먼트(MSA)에 관한 정보를 필요로 한다는 점이다. MSA는 단백질 배열의 데이터베이스를 검색하고 생명체의 기존 유사 배열을 특정한다. 한편 LLM은 이미 알고 있는 단백질과는 유사점이 없는 단백질의 구조를 예측할 수 있으며, 갑자기 변이가 일어났을 경우 단백질에서 일어날 수 있는 변화를 찾아낼 수 있다는 강점이 있다. 연구자들은 LLM의 알고리즘은 알파폴드에 비해 정확성이 부족하다고 생각하지만, LLM은 작업 속도가 상대적으로 빨라 불과 2주 만에 구조를 해명할 수 있다는 이점을 가진다. EMBL의 소장인 에디스 허드(Edith Heard) 교수는 이러한 혁명을 실제로 체험할 수 있다는 것은 과학자에게는 바라마지않는 행복이다라고 말한다.

 

중요한 것은 누구나 새로운 발견을 이용할 수 있다는 것이다. 알파폴드는 (인터넷상에서 무료로 열람할 수 있는) 오픈 액세스 프로그램이며, 메타 플랫폼도 데이터베이스를 만드는 데 필요한 코드를 공개하고 있다. 이러한 자세는 알고리즘에 있어 영역을 확대시키는 데 도움이 되며, 하이테크 기업이 알고리즘을 구축할 때 공개된 데이터베이스에 의존하고 있다는 상황을 반영한 것이라 할 수 있다.

 

딥마인드의 알고리즘은 EMBL이 가지고 있던 데이터가 없었다면 구축할 수 없는 것이었다. 허드 교수는 알파폴드를 정말로 게임 체인저로 만들고 싶었다면 이것을 오픈 액세스로 만들어 모든 사람과 공유했어야 한다고 말한다.

 

<그림1> 단백질 구조 예측 ~AI를 이용하여 단백질 배열을 통해 구조를 예측

위 그림은 어디까지나 예측이며, 실제와 다를 수 있음

 

AI가 신약 개발 성공률을 높이게 될 가능성

 

AI를 활용하는 예측이 과학 연구를 가속화하고 있다. 미국 콜로라도 대학교의 생화학자들은 10년에 걸쳐 해명하려 했던 박테리아의 단백질 구조를 15분 만에 확정할 수 있어, 항생 물질 내균성의 연구를 돕는다. 또한 영국의 포츠머스대학교에서는 플라스틱을 분해하는 효소를 개발하는 데 알파폴드를 사용하고 있다. 허드 교수는 이것은 지구의 회복에 도움이 된다. 훌륭한 일이다. 이렇게 빠른 속도로 연구를 진행할 수 있다니, 몇 년 전에는 상상조차 할 수 없었던 일이다라고 말한다.

 

스웨덴 스톡홀름에 있는 카롤린스카 연구소(Karolinska Institutet)는 요로 및 소화기관 내 세균 감염을 방지할 가능성이 있는 단백질 구조를 해명하는 데 알파폴드를 사용한다. 또한 옥스퍼드대학교에서는 기생충에 의한 감염 사이클의 모든 국면을 표적으로 하는 말라리아 백신을 개발하고 있어, 말라리아의 치료뿐 아니라 감염 방지에도 힘쓰고 있다. 지금까지 백신만으로 말리라아를 완치할 수 없었던 것은 수백 또는 수천 개의 표면 단백질이 존재하며 그 모든 것을 표적으로 특정할 수 없었기 때문이다. 알파폴드는 모기의 내장에 있는 기생충이 성장하는 데 꼭 필요한 단백질이며 주요 단백질 중 하나인 Pfs48/45를 특정함으로써 기존의 기술을 뛰어넘었다.

 

의약품 연구 분야에서는 잘못된 표적을 추구하느라 방대한 시간과 자금이 낭비되고 있다. 예측 AI는 신약 개발의 성공 확률을 높일 수 있다. 허드 교수는 지금까지는 시간과 자금이 많이 들어갔지만, 앞으로는 과학의 모든 분야가 꽃을 피울 것이라고 말한다.

 

알츠하이머형 치매 및 퍼킨슨병 등의 신경변성질환의 원인은 단백질 접힘 구조의 차이다. 신경변성질환 외에 당뇨병이나 암 등 현대인의 사인 중 상위권을 차지하는 질병의 원인은 대부분 인류가 수천 년간 숙적으로 삼아 온 세균이나 바이러스가 아니라 신체의 기능 부전이다. 대부분의 의약품이 체내 특정 단백질을 표적으로 삼아 작용하기 때문에, 잘못 접혀 있는 단백질의 구조에 대한 정보에 액세스하게 되면 약의 개발을 촉진하며, 표적으로 삼는 단백질과 정확하게 결합하여 그 기능을 바꾸는 약제를 설계할 수 있다. AI 프로틴의 허드 박사는 차세대 살충제 및 농사에서의 응용 등 의료 외 분야에서의 다양한 발전에도 낙관적이며, ‘이것은 생물하게 대한 지배를 해제하는 수단이다. 생물학에는 기본적으로 단백질이 개입하며, 단백질의 설계는 인류에게 생물학에 대한 전례 없는 지배를 선사하기 때문이다라고 말한다.

 

지침 책정이 급선무지만 예측 AI가 의학의 새로운 여명을 가져다줄 것인지에 대한 기대가 큼

 

애초에 질병과 관련된 모든 단백질이 약제에 반응하는 것은 아니다. 약물 분자와 확실하게 효과적으로 결합하지 못해 약에 반응하지 않는 단백질이 있기 때문이다. 이런 경우에도 리보핵산(RNA)에 초점을 맞추는 데 AI가 도움이 된다. RNADNA(유전자 정보를 가진 분자이며 생명체가 기능하는 데 꼭 필요한 단백질을 생성하기 위한 설계도)와 그러한 단백질의 생성 과정 사이의 중요한 단계이다. 인간의 세포가 만드는 서로 다른 10만 개 이상의 단백질은 각각 DNA 배열을 옮겨서 만들어지는 고유의 RNA 배열을 가진다.

 

단백질이 생성되기 전에 RNA를 표적으로 삼으면, 단백질의 생성 전 또는 생성 과정에서 약이 단백질을 바꿀 수 있다. 신종 코로나 바이러스 백신이나 일부 암 치료제 등의 RNA 치료제는 이미 수백만 명의 환자를 치료하는 데 사용되고 있으며, 컴퓨터상에서 RNA의 형상을 신속하고 정확하게 예측하는 능력은 RNA 분자의 이해를 촉진하고, 헬스케어 섹터에서의 이용 폭을 넓힐 것으로 생각된다.

 

미국 캘리포니아주에 거점을 둔 아토믹 AI(Atomic AI)의 창업주이자 최고 경영 책임자(CEO)인 라파엘 타운센드(Raphael Townsend)‘AI를 활용하는 RNA 구조 예측이 큰 효과를 보이는 이유는 필요한 RNA만을 표적으로 삼는 약제를 찾는 것이 매우 어렵기 때문이라고 설명한다. 그는 RNA 구조를 이해하게 되면 프로세스를 더욱 선택적으로 만들 수 있을 것이라고 생각한다.

 

지금까지의 성과는 미래가 기대되지만, 과학적인 면에서도 규제 면에서도 많은 과제가 남아 있다. 미국 식품의약품국(FDA)디지털 헬스 이노베이션 관련 행동 계획(Digital Health Innovation Action Plan)’은 디지털 헬스 프로덕트의 승인 프로세스를 가속화하는 것을 기대하며 2017년에 발표되었다. 또한 2021년에는 FDA가 영국 및 캐나다의 규제당국과 공동으로 책정한 의료기기 분야의 기계학습에 관한 지침을 발표했다.

 

제약 분야에서의 AI의 구체적인 사용법에 관한 지침은 아직 책정되지 않았지만, FDA는 정책을 입안할 때 검토해야 하는 사항을 명확하게 기재한 토의 자료를 공표하고 시민, 제약 업계, 연구기관 등으로부터 피드백을 받고 있다. AI 프로틴의 바르 박사는 규제당국이 이러한 사항을 시급히 검토해야 하는 것은 신약 개발에서 임상실험이 큰 장애가 될 것으로 예상되기 때문이다라고 경고한다.

 

사실 바르 박사는 의학의 새로운 여명을 기대하며 전체적으로 낙관적인 모습을 보인다. 박사는 생물학에서의 예측 AI는 생물 의학 연구 및 우주 물리학 등 모든 분야의 예술과 과학의 르네상스의 일부다. 모든 것이 상승효과를 일으키며 계산 기술의 발전이 실험실에서 사용되는 테크놀로지와 자동화의 발전과 더불어 앞으로 나아가고 있다고 말한다.

 

 

 

[생명공학 유망 영역별 글로벌 기술 및 연구개발 동향과 향후 과제] 보고서 상세보기

https://www.irsglobal.com/shop_goods/goods_view.htm?category=02000000&goods_idx=94301&goods_bu_id=

게시글 공유 URL복사