정보통신기술(ICT)을 활용해 의료 질을 향상시킨다는 '스마트병원' 개념이 인공지능(AI)과의 접목을 통해 서서히 구체화되고 있다.
영상 판독문을 알아서 분류하고 의료영상 진단 오류를 탐지하는 것은 물론 타이핑 대신 음성으로 간단히 차트를 작성하는 등 단순하거나 반복적인 업무 부담을 AI가 대신해 의료진은 그만큼 환자의 진료에 더 집중할 수 있다는 것.
19일 스위스그랜드호텔에서 개최된 대한의료인공지능학회 학술대회에서 의료 영역에서 인간의 판단 및 경험, 노동력에 의존해야 했던 부분의 업무 부담을 줄이기 위한 다양한 아이디어가 공유됐다.
스마트병원 시대를 열 핵심 키로 지목된 것은 방대한 양의 데이터를 기반으로 학습된 대규모 언어 모델(LLM). 일련의 텍스트에서 의미를 추출하거나 추론하고 단어와 구문 간의 관계를 이해하기 때문에 일상 언어로 질문하거나 명령을 내려도 그 의미를 이해해 적절한 업무를 처리할 수 있다.
일반인을 대상으로 상용화된 ChatGPT도 대규모 언어 모델을 사용하고 있지만 의료 영역에서는 전문 용어, 의학 용어, 축약어 등이 사용되고 질환별 환자 특성이 달라 각 의료기관, 전문과는 해당 특성에 맞는 방식의 LLM을 개발하거나 기존 LLM을 세부 조절해 적용하는 파인튜닝을 시도하고 있다.
이날 학회에선 최근 연구 동향을 살필 수 있는 다양한 포스터 연구가 발표됐다. 주요 방향성은 AI 기반의 진단 보조와 행정 업무 자동화로 요약된다. AI 진단은 기업이 개발한 전문 SW가 여러 적응증에서 상용화됐고 일부는 비급여 항목으로 지정된 까닭에 학계 연구는 연구 효율화를 위한 업무 자동화 등에 초점을 맞췄다.
삼성융합의과학원(SAIHST), 삼성서울병원 등이 진행한 응급실 의무기록지에 대한 개인정보 자동 삭제 방안 연구는 AI를 활용한 연구 효율화 방법론을 제시했다.
최근 BERT와 GPT와 같은 언어모델의 등장으로 자연어 처리 연구가 많은 주목을 받고 있고 의료계에서도 문자 서술형(free-text) 의료데이터를 자연어 처리 기술로 분석하려는 시도가 급속도로 증가하고 있다.
문제는 개인정보 보호법으로 의무기록을 연구에 활용하기 위해서는 철저한 가명 처리가 필요해 많은 수요에도 불구하고 국내 의료데이터는 자연어처리 연구에 손쉽게 활용되기 어렵다는 점.
의무기록 정보의 전문성으로 인해 의료진이 직접 개인정보에 해당하는 내용을 일일이 검토하고 가명 처리하는 번거로운 과정을 거쳐야 하는 실정이다.
연구진은 이같은 한계점을 해결하기 위해 한국어 언어모델인 DistilKoBERT를 적용, 응급실 의무기록지 내 개인 정보를 자동으로 인식할 수 있는지 여부를 확인했다. DistilKoBERT 성능은 문맥을 이해하기 때문에 Rule-base 방식인 정규 표현식보다 개인정보를 더 잘 분류한다는 것이 연구진의 판단.
차원철 성균관의대 교수(삼성서울병원 디지털혁신센터 센터장) 역시 '생성모델 범람의 시대 의료 인공지능의 나아갈 길' 발표를 통해 연구 효율화를 위한 AI 활용의 중요성을 언급한 바 있다.
차 교수는 "의료 데이터를 연구에 활용하려고 하면 환자를 특정할 수 있는 수술 날짜나 수술명, 나이 등의 정보를 삭제하는 가명화, 비식별화가 필요하다"며 "이런 요소를 찾아서 삭제하는 일이 쉽지 않기 때문에 인력에 의존할 수밖에 없었다"고 말했다.
그는 "무식해 보일 순 있지만 5천개 정도를 일일이 찾아서 삭제하기도 했다"며 "국가연구사업을 할 때는 3만개 정도의 자료를 해야 했기 때문에 인력에 의존할 수 없어 AI와 같은 다른 방향성을 고민하게 됐다"고 밝혔다.
연구의 규모가 커지고 고도화될 수록 인력에 의존하는 방식은 더 이상 작동할 수 없다는 것. 이날 업무 효율화, 자동화에 초점을 맞춘 연구들이 공개된 것도 비슷한 맥락이다.
서울의대 곽정원 연구팀은 한국어 의료 인공지능 개발을 위한 가상 의무기록지 생성 방법을 제시했다.
의료 현장에 적합한 인공지능을 개발하기 위해 한국어 의료 분야에 특화된 언어 모델을 구축해야 하고, 이를 학습시키기 위해서는 방대한 양의 의무기록지 데이터가 필요하지만 개인정보 보호와 규제 등으로 인해 접근이 제한될 수 있다.
이에 연구진은 충분한 양의 실제 의무기록지 데이터를 수집하는 것이 어려울 경우 적은 양의 실제 데이터를 유사한 가상 데이터 형태로 증강해 데이터 확보 문제를 해결하는 한국어 가상 의무기록지 생성 방법을 제시했다.
이외에도 대규모 언어모델을 활용한 영상 판독문 레이블링 연구, 의료영상 진단 오류 탐지를 위한 인공지능 모델 개발, 시간의 흐름에 따른 응급실 내원 환자의 사망 예측 기계학습 모델 개발 및 검증, 소아 발열의 원인을 탐지하는 딥러닝 기반 스마트폰 앱 연구 등이 공개됐다.
AI가 사실과 다른 내용을 창조해 제시하는 환각(hallucination) 현상은 의료 분야에서 AI의 활용을 제한하는 걸림돌로 작용한다. 서울대학교 의학정보학연구소 등이 참여한 연구팀은 생성형 AI를 사용해 갑상선 수술 기록에서 환각을 탐지하고 교정한 연구 결과를 제시했다.
ex) medi****** 아이디 앞 네자리 표기 이외 * 처리
댓글 삭제기준 다음의 경우 사전 통보없이 삭제하고 아이디 이용정지 또는 영구 가입이 제한될 수 있습니다.
1. 저작권・인격권 등 타인의 권리를 침해하는 경우
2. 상용프로그램의 등록과 게재, 배포를 안내하는 게시물
3. 타인 또는 제3자의 저작권 및 기타 권리를 침해한 내용을 담은 게시물
4. 욕설 및 비방, 음란성 댓글