산모의 DNA와 RNA 정보에 거대 언어 모델(LLM)을 결합해 90%에 가까운 정확도로 조산을 예측하는 인공지능 모델이 나와 학계의 주목을 받고 있다.
현재까지 조산 예측을 위한 다양한 검사법이 있지만 대부분 침습적인데다 정확도가 높지 않았다는 점에서 고위험 임신 조기 진단과 대처에 획기적 전환점이 될 수 있다는 것이 전문가들의 의견이다.
28일 의료산업계에 따르면 산모의 유전체와 전사체 정보에 거대 언어 모델을 통합해 조산을 예측하는 인공지능 모델이 개발된 것으로 확인됐다.
현재 조산은 전 세계적으로 산모와 신생아의 이환율과 사망률의 주요 원인으로 꼽히며 매년 1500만명의 아기가 이에 대한 위험에 노출돼 있는 것으로 보고되고 있다.
이는 전 세계 출생아의 약 11%에 해당하는 비율로 이를 막기 위해 다양한 진단 모델이 개발되고 있지만 아직까지 예측할 수 있는 단일 지표는 부족한 것이 사실.
특히 대부분의 검사가 침습적 행위가 동반된다는 점에서 이에 대한 산모들의 거부감도 큰 상황이다.
정밀 의학 솔루션 기업인 BGI Genomics가 개발한 새로운 인공지능 모델에 관심이 모아지고 있는 것도 이러한 이유 때문이다.
만약 산모의 혈액 검사만으로 조산 위험을 예측할 수 있다면 고위험 산모의 조기 진단과 대처에 큰 도움이 될 수 있기 때문이다.
이 모델의 특징은 산모의 혈액을 순환하는 유전 물질인 무세포 DNA(cfDNA)와 무세포 RNA(cfRNA)를 분석한 뒤 거대 언어 모델인 GeneLLM에 해석을 맡기는 것이 특징이다.
말 그대로 유전체학과 전사체학에 거대 언어 모델을 결합해 멀티오믹스를 통한 통합 인공지능 모델을 만든 셈이다.
npj 디지털 의학(npj Digital Medicine)에 공개된 검증 연구에서 이 모델은 높은 정확도를 보이며 기대감을 충족했다(10.1038/s41746-025-01942-2).
실제로 682명의 실제 산모를 대상으로 검증한 결과 cfDNA와 거대 언어 모델을 결합한 인공지능은 정확도를 보여주는 지표인 곡선하 면적(AUC)이 0.822를 기록했다. 82%의 정확도로 조산 위험을 예측할 수 있다는 의미다.
또한 cfRNA와 거대 언어 모델을 결합한 인공지능은 AUC가 0.851로 미세하게 더 높았다.
하지만 cfDNA와 cfRNA 데이터를 통합한 모델은 유의미하게 정확도가 향상되며 AUC가 0.890으로 분석됐다. 거의 90%에 가까운 정확도로 조산을 미리 알려주는 셈이다.
연구진은 이를 기반으로 멀티오믹스에 거대 언어 모델을 결합한 인공지능이 향후 질환 및 예후 예측에 큰 흐름이 될 것으로 전망했다.
BGI Genomics 수석 연구 위원이자 해당 논문의 제1 저자인 저우 시(Zhou Si) 박사는 "멀티오믹스와 거대 언어 모델의 결합이 얼마나 혁신적인 힘을 보이는지를 보여주는 매우 의미있는 결과"라며 "향후 고위험 임신의 조기 발견 및 중대에 중요한 발걸음이 될 것"이라고 밝혔다.
ex) medi****** 아이디 앞 네자리 표기 이외 * 처리
댓글 삭제기준 다음의 경우 사전 통보없이 삭제하고 아이디 이용정지 또는 영구 가입이 제한될 수 있습니다.
1. 저작권・인격권 등 타인의 권리를 침해하는 경우
2. 상용프로그램의 등록과 게재, 배포를 안내하는 게시물
3. 타인 또는 제3자의 저작권 및 기타 권리를 침해한 내용을 담은 게시물
4. 욕설 및 비방, 음란성 댓글