게시물 검색

바이오/의료 의료용 AI 왓슨(Watson)

  • 관리자 (irsglobal1)
  • 2020-05-15 22:28:00
  • hit569
  • 112.171.243.162

(1) 활용이 확대되는 의료용 왓슨

 

2015년경부터 시험적으로 도입되기 시작한 왓슨은, 당초 신기하게 바라보는 시선도 작용하여 높은 평가를 받는 경우가 많았다. 하지만, 그로부터 몇 년이 지난 후, 왓슨은 (그것을 본격적으로 사용하기 시작한) 의료 관계자들 사이에서 다양한 평가를 받게 되었다.

 

이에 대해서는, 미국의 바이오ㆍ의료 관련 미디어로서 가장 큰 신뢰를 받고 있는 ‘STAT’이나 미국의 월스트릿 저널지 등이 자세한 조사 보도를 낸 바 있다.

 

이에 따르면, 의료용 왓슨은 미국, 인도, 한국, 대만, 슬로바키아 등 수많은 국가ㆍ지역에서 사용되고 있다. 그러한 국가에서 왓슨을 도입한 병원의 수는 총 200개 이상이다.

 

왓슨은 인터넷을 통한 클라우드 서비스로서 제공된다. 예를 들어, 암 의료용 왓슨은 ‘Watson for Oncology’, 게놈 의료(환자의 DNA 정보에 근거한 신형 의료)용 왓슨은 ‘Watson for Genomics’ 등 서로 다른 서비스(제품)로 제공된다. (이 2가지 이외에도 몇 가지 서비스가 마련되어 있다)

 

왓슨의 사용요금은 그 서비스의 종류와 수에 따라 환자 한 명당(미국 달러로) 200~ 1000달러로서, 차이가 크다. 왓슨을 도입한 병원에서는 주로 (앞서 말한) 암 의료 및 게놈 의료용 왓슨을 사용하는 경우가 많다.

 

왓슨은 병원 측이 IBM과 왓슨의 이용 계약을 맺은 시점에 곧바로 사용할 수는 없다. 왓슨을 이용하려면, 그 준비 단계로서 병원 측의 직원, 즉 의사나 IT 시스템 담당자가 함께 다수의 환자의 ‘진료기록(medical record)’을 왓슨에 입력해야한다.

 

이것은 병원 측이 사전에 예상했던 것보다 훨씬 더 부담이 높은 작업이다. 주로 (원래 인간 의사가 작성한) 진료기록이 번잡하거나 규칙적이지 않기 때문이다. 즉 병원에 축적돼 있는 방대한 진료기록에는 종종 약어가 사용되거나 서로 다른 의사가 각기 다른 표기법을 사용하거나 때로는 잘못 기록하기도 하기 때문에, 그것을 모두 수정하여 왓슨이 처리할 수 있는 형태의 표준 포맷으로 통일시키는 것만도 엄청난 작업이기 때문이다. 따라서 병원 측에서는 도입한 왓슨을 의사가 사용할 수 있는 상태로 만들기까지 오랜 시간을 투자해야 한다.

 

(2) 왓슨의 원리적 한계

 

이러한 작업을 완료하여 사용이 가능해진 왓슨에 대한 의사의 평가는 다양하다.

 

왓슨의 주요 역할은 의사를 보조하는 것이다. 왓슨은 의사에게 질병에 대한 진단 및 치료법에 관한 ‘권고(recommendations)’를 제공함과 동시에 그 근거에 해당하는 과거의 의학논문이나 결론에 이르기까지의 사고 과정 등도 참고 사항으로서 제시한다.

 

이때 의사가 왓슨의 성능을 평가할 때 주로 사용하는 평가 기준이 바로, 왓슨의 권고가 의사 자신의 생각(진단, 치료법)과 일치하는지 여부이다. 이와 관련하셔, (왓슨을 시험적으로 도입한) 덴마크의 한 병원에서는, 그 일치율이 불과 33%밖에 되지 않아 협의 끝에 왓슨을 도입하지 않기로 했다. 즉, ‘왓슨의 권고는 신뢰성이 떨어진다’고 판단한 것이다.

 

반대로 다른 병원에서는 왓슨의 권고와 의사의 생각이 일치하는 비율이 96%에 달하기도 했다. 하지만 이처럼 일치율이 높으면, 왓슨에 대한 의사의 평가도 높아지는가 하면, 꼭 그렇지만도 않다.

 

왜냐하면 왓슨이 제시한 진단 결과나 치료법이 의사의 생각과 일치할 경우, 대부분의 의사들은 ‘그 정도는 네가 말 안 해줘도 알아’라고 생각하기 때문이다.

 

반대로 왓슨과 의사의 생각이 상반되었을 경우, 의사는 ‘네 말이 정말로 맞을까? 믿어도 되는 걸까?’라는 불신감을 갖게 된다. 즉, 결과가 어떠하든 왓슨에 유리하지는 않다.

 

물론, 가령 왓슨의 권고가 의사의 생각과 다르더라도 왓슨이 스스로가 옳다는 것을 입증하기 위해 뒤통수를 한 대 맞은 것처럼 참신한 발상이나 신선한 사고 과정을 보충 정보로서 제시한다면, 의사도 납득할 수 있을지 모른다. 애초에 병원이 왓슨을 도입하기로 한 가장 큰 이유는, 이 AI 컴퓨터가 의사 즉, 사람은 절대로 생각할 수 없을 만한 독창적인 진단이나 치료법을 내놓기를 기대하기 때문이다.

 

그런데, 왓슨의 원리상, 그것은 불가능하다. 왜냐하면 왓슨이 의사에게 제공하는 진단과 치료법은 원래 의사(인간)가 왓슨에 입력한 것이기 때문이다. 앞서 밝힌 것처럼 왓슨을 암 의료용으로 맞춤화(교육)할 때, 암 전문 의료 연구기관인 ‘MSKCC’의 의사들이 오랜 시간에 걸쳐 ‘환자의 증상이 이러 이러한 경우에는 이렇게 진단하고, 이러한 치료법을 제시하라’는 가르침을, 대량으로 왓슨에 입력했기 때문이다.

 

즉, 왓슨의 본질을 비유적으로 표현하면, ‘MSKCC의 의사단이 통째로 (왓슨이라는) 컴퓨터에 들어있는 것’이나 마찬가지이다. 왓슨이 제시하는 진단이나 치료법은 원래 그들 의사(인간)로부터 기인한 것이므로, 그것이 인간을 뛰어넘는 독창적인 아이디어나 사고 과정을 제시할 수는 없다. 미국의 언론 보도는 모두 기본적으로 이러한 견해를 나타내고 있다.

 

사실, 이러한 한계에 대해서는 1970~80년대에 ‘제2차 AI 붐(AI 버블)’이 일었다가 주위의 기대가 실망으로 바뀌었을 때쯤 이미 지적된 바 있다. 당시 AI는 ‘규칙 기반 AI’, 그 중에서도 ‘전문가 시스템’이라 불리는 방식이 주류를 이루었다. 이러한 AI는, 예를 들어 의사와 같은 특정 분야의 전문가의 지식이나 노하우를 프로그래밍 언어로 삼아 규칙화하여 컴퓨터에 이식하면, 그 컴퓨터(AI)가 전문가를 대신하여 일을 한다는 기본 사상에 근거하여 개발되었다.

 

이것은 현재의 왓슨과 공통되는 부분이다. 물론 왓슨이 지금으로부터 40년도 더 전의 전문가 시스템과 완전히 똑같지는 않지만, 족히 반세기 이상에 이르는 AI 연구 성과를 축적해온 IBM이 일종의 고전적인 AI 방식을 개량하여 현대에 그것을 되살렸을 것이라고도 충분히 생각해볼 수 있다. 실제로 그러한 부분을 곳곳에서 찾아볼 수 있다.

 

(3) 미국에서의 평가

 

○ 위와 같은 (암 의료용) 왓슨에 대한 평가는 국가와 지역마다 다르다.

 

앞서 말한 미국 언론 보도에 따르면, 미국에서의 평가는 아직 마땅치 않다. 예를 들어, 플로리다주의 첨단 의료병원 ‘Jupiter Medical Center’에서 73세의 폐암 환자에 대해, 왓슨은 ‘화학요법이 타당’하다고 권고했지만, 그것은 이미 해당 병원의 의사도 생각하고 있던 것이었다.

 

여느 때처럼 ‘뭐, 그럭저럭이네(It’s fine)’라는 식의 냉소적인 평가밖에 받지 못했다.

 

하지만 왓슨은 그러한 치료법을 제시하게 된 이유로서, 그것을 뒷받침하는 의학 전문 잡지의 논문ㆍ기사 등도 제시한다. 그래서 의사는 자신의 치료법에 자신감을 갖게 되며, 그 치료법에 관한 최신 정보 등을 얻을 수도 있다. 이러한 점에서 왓슨은 미국의 의료 관계자로부터 어느 정도는 평가를 받고 있다.

 

여기에서 볼 수 있듯이, 왓슨에는 MSKCC의 의사들이 입력한 진단ㆍ치료법과 함께 (왓슨을 암 의료용으로 맞춤화하는 초기 단계에서) 42종류에 이르는 암 전문 잡지로부터 약 200만 페이지의 의학 논문이 입력되어 있으며, 이러한 전문적인 정보는 그 후로도 계속해서 갱신된다.

 

왓슨은 의사에게 권고를 할 때, 이러한 의학 문헌을 검색하고, 실제 환자의 증상과 관련이 있는 것으로 보이는 정보를 의사에게 제시한다. 의사 즉 인간의 기억력에는 한계가 있지만, 왓슨은 어마어마한 기억 용량과 고속 프로세서를 갖고 있기 때문에, 한 사람의 인간이 포용할 수 없는 방대한 양의 의학 정보를 축적하고, 필요에 따라 곧바로 검색할 수 있다.

 

하지만, 여기에는 큰 문제, 또는 과제가 존재한다. 바로 ‘이러한 의학 정보가 수시로 갱신되어야 한다’는 점이다. 전 세계의 대학과 의료기관에서는 매일같이 격렬한 연구 경쟁을 펼치고 있으며, 암에 관한 의학 논문만 해도 연간 20만 개 이상이 발표되고 있다. 따라서 왓슨의 기억 장치에 축적되어 있는 학술지의 논문ㆍ기사 등의 의학 정보 역시 이러한 최신 연구 성과를 항상 반영하고 갱신되어야만 시대에 뒤처지지 않을 수 있다.

 

이것은 단순히 의학 논문만의 이야기가 아니다. MSKCC의 의사들이 당초 왓슨에 입력한 진단ㆍ치료법에 대해서도 마찬가지여야 한다. 예를 들어, ‘전이성 폐암’에 관한 치료 가이드라인은 암에 관한 국제학회에서 어떠한 연구 성과가 발표된 후로 불과 일주일 만에 변경되는 경우도 있다. 이처럼 하루가 다르게 바뀌는 정보를, (왓슨의 운용 담당자가) 지속적으로 갱신하는 것은 쉬운 일이 아니다.

 

그 결과, 특히 미국과 같은 의료 선진국에서는 ‘왓슨이 제공하는 치료법이나 의학 정보가 최신 정보라 말할 수 없다’며 실망하는 의사도 적지 않다.

 

사실은 이러한 문제도 1970~80년대의 규칙 기반 AI, 즉 전문가 시스템이 물러나게 된 중요한 요인 중 하나였다. 당시에도 각계 전문가의 노하우 등을 축적한 ‘데이터베이스(AI가 따라야 하는 규칙모음)’를 수시로 갱신해야 한다는 필요성에 쫓겨, ‘지식 엔지니어’라 불리는 전문가 시스템 전문요원을 (해당 시스템을 도입한) 클라이언트 각사에 상주시켜야만 했다.

 

하지만, 그 인건비가 어마어마하게 불어나, 클라이언트 기업을 비롯하여 업계 전체에 ‘이럴 바에는 AI로 업무를 자동화하는 것보다 차라리 진짜 전문가(인간)를 고용하는 것이 더 낫다’는 인식이 퍼졌다. 이것이 전문가 시스템이 실패한 요인이 되었고, 그 후 ‘AI의 겨울’이라 불리는 정체기를 맞이하게 되었다. 현재의 왓슨 역시 본질적으로는 당시의 AI와 같은 문제를 갖고 있다.

 

(4) 왓슨에서 볼 수 있는 편향

 

위와 같은 미국과는 대조적으로, 왓슨이 매우 높은 평가를 받고 있는 곳은 아시아권을 중심으로 의료 분야가 비교적 개발도상에 있는 국가들이다. 구체적으로 말하자면 인도, 또는 (후에 기술할 태국 등 일부 예를 제외하고) 동남아시아 국가들의 병원에서 일하는 의사들은 입을 모아 ‘왓슨 덕분에 시간을 절약하고, 더 많은 환자에게 질 높은 의료 서비스를 제공할 수 있게 되었다’고 말한다.

 

그 중에서도 중앙아시아에 위치한 몽골의 경우가 눈에 띈다. 몽골의 수도인 울란바토르에 있는 한국계 종합병원 ‘UB Sondo Hospital’에 도입된 (암 치료용) 왓슨은 의사들 사이에서 큰 힘이 되고 있다.

 

왜냐하면 해당 병원에는 암 전문의가 한 명도 없기 때문이다. 왓슨이 도입되기까지 일반 의료에 종사하는 의사들이 암 환자를 치료해 왔다. 그들은 암에 관한 전문지식을 아예 갖고 있지 않거나 매우 한정된 지식만 갖고 있다.

 

래서 왓슨을 도입한 이후 해당 병원의 의사들은 왓슨의 권고를 거의 100% 따른다. 앞서 말한 것처럼 왓슨은 ‘MSKCC’라는 세계적인 굴지의 암 연구기관에서 이루어진 진료ㆍ치료법 및 전문지식을 갖고 있다.

 

따라서, 해당 병원에서 암 환자를 진단ㆍ치료하는 의사들이 볼 때에는, (암에 대해서는 거의 초보자라 할 수 있는) 자신들의 생각을 따르는 것보다는 왓슨의 권고를 따르는 것이 더욱 안전하고 확실한 진료라고 생각한다.

 

한편, 똑같은 아시아권이라 해도 한국이나 대만, 태국 등 의료 수준이 비교적 높은 국가ㆍ지역에서는 왓슨에 대해 복잡한 생각을 갖고 있다. 왜냐하면 왓슨은 MSKCC 등 미국의 연구기관에 의해 의료용으로 맞춤화된 시스템이기 때문에, 왓슨이 제공하는 진단ㆍ치료법 등은 아무래도 미국의 환자들에게 편향되어 있기 때문이다.

 

단순한 예로, 환자의 체격 차이를 들 수 있다. 백인이나 아프리카계 사람들이 많이 사는 미국에서는 환자의 평균 체격이 아시아권의 환자보다 훨씬 크다. 그래서 같은 약을 투여하는 경우에도 (왓슨의 권고를 따라) 미국인에게 투여하는 양을 그대로 아시아권 환자에게 적용시키면, 과잉 투여가 될 수도 있다.

 

이러한 문제를 미연에 방지하려면, 아시아권에 있는 병원의 의사들이 ‘약의 투여량’을 비롯한 왓슨이 제시하는 치료법을, 아시아인 환자에게 맞게 ‘현지화’해야 한다.

 

실제로 태국의 수도 방콕에 있는 종합병원 ‘Bumrungrad International Hospital’에서는 일단 도입한 왓슨을 (같은 아시아권에 속한) 일본의 치료 가이드라인 등을 참고로 하여 현지화한다.

 

하지만, 모처럼 그렇게 재조정한 왓슨을, 해당 병원의 의사들은 많이 사용하지 않는다. 가장 큰 이유는 의사들이 왓슨을 현지화하는 과정에서 평소 자신들이 지역의 환자를 진단ㆍ치료할 때의 노하우나 의학 지식을 왓슨에 입력했기 때문이다.

 

그 결과, 새롭게 태어난 왓슨에는 태국 의사들의 진단ㆍ치료 정보가 쌓이게 되었다. 따라서 그들이 환자를 진단할 때 왓슨을 사용하더라도, 그들 자신이 이미 입력한 정보가 되돌아볼 뿐이다. 그러면 왓슨을 사용하는 의미가 없게 될 것으로 보인다.

 

(5) 왓슨의 장점

 

이처럼 본격적으로 도입되기 시작한 지 여러 해가 지난 왓슨에 대한 전 세계 의료 관계자들의 견해는, 결과적으로는 긍정적이지 않다. 하지만 앞으로의 가능성까지 생각하면, 높게 평가하는 전문가도 적지 않다. 그들은 왓슨으로 대표되는 의료용 AI가 ‘과학적 에비던스(증거)’에 근거한 새로운 의료를 실현하고, 지금까지의 히에라르키(계급)적인 의료 현장을 개혁할 수 있다‘고 기대한다.

 

국내 ‘가천대학교 길병원’에서 왓슨을 이용하고 있는 의사는 다음과 같은 사례를 들어 그 가능성을 설명한다.

 

지금까지 병원에서 볼 수 있었던 계급적인 의료 현장에서는, 항상 연장자이며 지위가 높은 의사의 의견이 젊고 지위가 낮은 의사의 의견보다 우선시되어 왔다. 하지만 앞으로는 젊은 의사들도 왓슨을 사용하여 최신 의료 정보를 입수하고, 그것을 회의 등에서 제시함으로써 ‘이러한 치료법이 환자를 더 잘 도울 수 있다’라고 설득할 수 있다.

 

이처럼 과학적인 근거를 제시한다면, 윗사람(선배 의사)들도 모두의 앞에서 자신의 의견을 무작정 주장할 수는 없을 것이라는 말이다.

 

또한, 인도의 종합병원 연쇄점 ‘Manipal Hospitals’의 의사의 말에 따르면, 해당 병원에 입원해 있는 대장암과 유방암 환자에게, 왓슨은 불과 몇 초 만에 최적의 치료법을 제시했다고 한다. 이러한 정보는 보통, 해당 병원에 근무하는 20명의 암 전문의가 약 일주일 동안 회의를 거쳐야만 도출할 수 있는 결론이라고 한다.

 

현재의 왓슨은 ‘의학 정보를 수시로 갱신해야 하는 필요성’ 및 ‘정보의 편향’과 같은 과제를 안고 있지만, 이것이 해결되면, AI에 의한 의료 현장의 민주화 및 효율 향상 등 큰 이익도 기대해볼 수 있다.

 

 

 

관련도서 : 2020 의료 분야 ICT 신기술의 사업화 동향 및 기술개발 전략

http://www.irsglobal.com/shop_goods/goods_view.htm?category=05000000&goods_idx=83770&goods_bu_id=

  

 

 
게시글 공유 URL복사