[메디칼타임즈] AI 위원회의 위력…아무 학습 없이 의사시험 통과

5개 인공지능이 상호간에 반복적인 논의를 통해 정답을 도출하는 이른바 AI 위원회(Council of AIs)가 우수성을 입증하며 새로운 패러다임을 제시하고 있다.

미국 의사시험(USMLE)를 최대 97%의 정확도로 사실상 만점에 가까운 성적을 기록하며 높은 정확성을 보였기 때문이다.

현지시각으로 10일 국제학술지 플로스(PLOS)에는 AI 위원회의 정확성에 대한 연구 결과가 공개됐다(10.1371/journal.pdig.0000787).

지금까지 미국 의사시험은 인공지능의 학습과 정확도를 시험하기 위한 장이 된 것이 사실이다.

일부 인공지능이 높은 성적으로 이를 통과하며 가능성을 입증했지만 반복해서 시험을 보게할 경우 점수차가 크게 나타나는 등 신뢰도에는 한계가 있었던 것이 사실.

볼티모어 의과대학 야히아 셰이크(Yahya Shaikh) 교수가 이끄는 연구진이 이른바 AI 위원회를 구성하는 방안을 내놓은 것도 이러한 이유 때문이다.

만약 인공지능이 서로 논의하며 오답을 지워나간다면 정확도를 높이는 동시에 신뢰도를 확보할 수 있다는 판단에서다.

이에 따라 연구진은 챗 지피티를 중심으로 5개의 인공지능 솔루션을 결합한 AI 위원회를 구성하고 합의된 응답을 내놓기 위해 상호간에 조정을 반복하는 알고리즘을 개발했다.

또한 이를 시험하기 위해 1단계는 생물 의학, 2단계는 임상 지식, 3단계는 독립적 의료 행위로 구성된 미국 의사시험에 적용했다.

총 325개의 문제를 제공한 결과 이 AI 위원회는 1단계는 97%, 2단계는 93%, 3단계는 94%의 정확도로 매우 우수한 성적으로 합격했다.

이는 지금까지 다양한 인공지능으로 진행한 시험에 비해 월등하게 높은 정확도로 특히 반복되는 시험에도 이러한 수치는 변함없이 지속됐다.

이러한 배경에는 사람의 논의 과정과 동일하게 구성된 '위원회'의 힘이 있었다. 실제로 AI 위원회는 다수결로 정한 오답도 재논의를 통해 53%를 수정하는데 성공했다.

또한 만장일치가 성립되지 않은 문제에 대해 수차례 지속적으로 상호 논의를 거치며 83%의 문항을 새롭게 검토했다. AI끼리 이른바 집단 지성을 이룬 셈이다.

연구진은 이러한 위원회가 향후 인공지능 발전에 새로운 패러다임이 될 것으로 내다보고 있다. 단일 모델이 할 수 없는 신뢰도를 확보할 수 있다는 기대다.

야히아 셰이크 교수는 "특히 이번 연구는 인공지능에 아무런 의학지식을 학습하지 않은 상태로 진행됐다는 점을 주목해야 한다"며 "인공지능이 배경지식 없이 상호간의 논의를 통해 오답을 지워나가며 답을 유추했다는 뜻"이라고 설명했다.

그는 이어 "이는 인공지능이 학습된 지식을 넘어 새로운 가능성과 해법을 제시하는 단계로 성장할 수 있다는 것을 의미한다"고 밝혔다.

AI 위원회의 위력…아무 학습 없이 의사시험 통과