

의료 AI와 임상 역량의 퇴화(상-클릭)에 이어서 연재합니다. 마지막에는 설문조사가 있으니 한번씩 참여를 부탁드립니다.
05 윤리·법·사회적 쟁점
윤리. 기술만 퇴화하는 것이 아니다
[메디칼타임즈=유소영 교수-아산병원]De-skilling의 문제는 기술적 숙련에만 머물지 않습니다. 의료에서 더 중요한 것은 판단의 습관, 책임의 감각, 환자를 직접 읽어내는 능력이 함께 약화될 수 있다는 점입니다.
철학자 Shannon Vallor는 '도덕적 de-skilling(moral deskilling)'이라는 개념을 통해, 자동화가 인간의 도덕적 판단 연습을 줄일 때 사라지는 것은 단순한 지식이나 기능이 아니라 도덕적 판단을 형성하는 습관 자체라고 지적했습니다[7]. 의료에서 이 문제는 특히 중요합니다. AI가 치료 방침을 제안할 때, 의사가 "이 환자에게 이것이 적절한가", "이 선택이 환자의 가치와 상황에 맞는가", "내가 이 판단의 책임을 질 수 있는가"를 스스로 묻는 빈도가 줄어든다면, 약화되는 것은 임상 지식만이 아닙니다. 의사로서 책임 있게 판단하는 방식 자체가 약해질 수 있습니다.
Cabitza는 이와 관련해 '기호적 de-skilling(semiotic deskilling)'을 논의합니다[7]. 이는 환자의 표정, 호흡, 자세, 피부색, 말의 속도, 불안의 정도처럼 숫자와 영상으로 완전히 환원되지 않는 임상적 징후를 읽어내는 능력이 약화될 수 있다는 문제입니다. 의료 AI는 검사 결과와 데이터 패턴을 더 빠르게 분석할 수 있지만, 환자의 몸과 말, 침묵과 표정이 전하는 의미를 모두 대신 읽어 주지는 못합니다. 의사가 화면의 경고와 수치에 더 오래 머물수록, 환자를 직접 관찰하고 해석하는 시간은 줄어들 수 있습니다. 이것은 단순한 기술 변화가 아니라, 의사와 환자 사이의 관계가 어떻게 재구성되는가의 문제입니다.
법. 책임은 여전히 인간에게 남아 있는가
법적 쟁점은 더 복잡합니다. 의료 AI가 임상 현장에 들어올수록 의사는 두 방향의 압력을 동시에 받게 됩니다.
한쪽에서는, 검증된 AI 도구가 널리 사용되고 표준적 진료 흐름의 일부가 될 경우, 이를 전혀 고려하지 않은 진료가 향후 합리적 의료의 기준에 미치지 못한다고 평가될 가능성이 있습니다. 미국 법학원(American Law Institute)은 2024년 의료과오법 Restatement를 승인하면서, 의료과오 판단에서 단순한 관행(customary practice)보다 합리적 의료(reasonable medical care)와 근거 기반 판단을 더 중시하는 방향을 제시했습니다[15]. 이는 AI가 충분히 검증되고 임상적으로 유용한 도구로 자리 잡는다면, 언젠가는 "합리적 의사라면 AI를 어떻게 고려했어야 하는가"가 법적 쟁점이 될 수 있음을 시사합니다.
다른 한쪽에서는, 의사가 AI를 사용했다는 사실만으로 책임이 면제되지는 않습니다. 미국 의료면허위원회(FSMB)는 2024년 4월 채택한 보고서에서 "의사가 AI를 사용하기로 선택한 순간, AI 권고에 대한 적절한 응답의 책임을 진다"고 명시했습니다[16]. 즉 AI 권고를 따랐는지, 따르지 않았는지보다 더 중요한 것은 의사가 그 권고를 어떤 근거로 검토했고, 자신의 임상 판단에 어떻게 반영했는지를 설명할 수 있는가입니다. 단순히 "AI가 그렇게 제안했다"는 말만으로는 전문직 책임을 대체하기 어렵습니다. 단순히 AI의 권고를 따랐다는 것만으로는 표준 치료(standard of care)를 충족하지 못할 수 있다는 명시적 경고입니다[16]. 한편 미국의사협회(AMA)는 의사 단독 책임이 아니라 개발사·의료기관과의 '공동 책임' 입장으로 일부 이견을 표명하고 있어, 책임 분배 논의는 현재 진행형입니다.
이 지점에서 의료 AI의 법적 긴장이 생깁니다. AI가 충분히 유용한 도구로 인정되면, 의사는 AI를 전혀 고려하지 않은 데 대해 설명을 요구받을 수 있습니다. 반대로 AI를 사용했다면, AI의 오류를 왜 발견하지 못했는지, 왜 그 권고를 수용했는지, 왜 거부했는지를 설명해야 할 수 있습니다. 문제는 장기적 AI 의존이 바로 그 설명과 검토의 능력, 즉 AI의 오류를 식별하고 독립적으로 판단하는 능력을 약화시킬 가능성이 있다는 점입니다.
따라서 의료 AI의 책임 문제는 단순히 "최종 책임은 의사에게 있다"는 문장만으로 해결되지 않습니다. 의사, 의료기관, AI 개발사, 배치·운영 책임자, 인허가 및 사후관리 체계가 각각 어떤 의무를 부담해야 하는지 더 정교하게 나누어야 합니다. 특히 AI가 의료인의 판단 방식과 역량 형성에 영향을 미칠 수 있다면, 책임 법리도 개별 사건의 과실 판단을 넘어 교육, 배치, 모니터링, 사용자 훈련의 책임까지 함께 고려해야 합니다.
사회. 의사-환자 관계의 변형
의료 AI가 바꾸는 것은 의사의 기술과 법적 책임만이 아닙니다. 환자가 의사를 신뢰하는 방식도 달라질 수 있습니다.
환자 신뢰의 중요한 기반 중 하나는 "내 의사가 나를 직접 보고, 내 상황을 이해하고, 나를 위해 판단한다"는 감각입니다. 물론 현대 의료는 이미 검사, 영상, 알고리즘, 전자의무기록에 깊이 의존하고 있습니다. 그러나 AI가 진단과 치료 선택지까지 제안하기 시작하면, 환자는 의사의 판단이 어디까지 의사의 것인지, 어디서부터 시스템의 제안인지 묻게 됩니다. 이 질문에 충분히 답하지 못하면 환자 신뢰는 약해질 수 있습니다.
Dias Duran은 de-skilling이 환자 신뢰를 약화시키고, 환자를 개별적 존재가 아니라 데이터 패턴의 사례로 보게 만들 위험을 지적했습니다[7]. 이 우려는 의료 AI에서 특히 중요합니다. AI는 환자를 과거 데이터 속 유사한 사례와 비교해 분류합니다. 그 자체가 잘못은 아닙니다. 문제는 의사까지 환자를 "이 모델이 분류한 유형으로만 보기 시작할 때 발생합니다. 환자의 삶, 선호, 두려움, 돌봄 환경, 말로 표현되지 않는 맥락이 판단에서 밀려날 수 있기 때문입니다.
NEJM AI에 발표된 역사적 관점의 논문은 이 논의를 더 넓은 맥락에 놓습니다[17]. De-skilling에 대한 불안은 의학사에서 처음 등장한 것이 아닙니다. 교과서, 포켓 가이드, 전자의무기록, 임상 의사결정 지원 도구가 도입될 때마다 의사의 기억, 판단, 숙련이 약해질 수 있다는 우려가 제기되었습니다. 그러나 의료 AI는 이전 도구들과 다른 지점을 갖습니다. 이전 도구들이 주로 정보를 저장하고 제공했다면, AI는 점점 더 판단의 후보를 생성하고, 선택지를 제안하며, 의사의 사고 흐름에 직접 개입합니다.
따라서 의료 AI의 사회적 쟁점은 "AI를 쓰는가, 쓰지 않는가"가 아닙니다. 핵심은 AI가 개입한 진료에서도 환자가 여전히 의사의 책임 있는 판단을 경험할 수 있는가입니다. 환자는 AI가 배제된 진료를 요구하는 것이 아니라, AI가 사용되더라도 자신의 의사가 그 결과를 이해하고, 검토하고, 자신의 상황에 맞게 해석하며, 최종적으로 책임 있게 설명해 주기를 기대합니다.
결국 윤리·법·사회적 쟁점은 하나의 질문으로 모입니다. 의료 AI가 의사의 판단을 보조할수록, 우리는 무엇을 보존해야 하는가. 보존해야 할 것은 단순히 AI 없이 일할 수 있는 기술만이 아닙니다. 환자를 직접 읽는 감각, 스스로 판단하는 습관, 판단의 이유를 설명하는 능력, 그리고 그 판단에 책임지는 전문직의 태도입니다.
06 한국 맥락. 의료 AI 거버넌스의 빈칸: 역량, 수련, 책임
한국은 의료 AI를 비교적 빠르게 임상 현장에 도입하고 있는 국가입니다. 영상의학, 내시경, 병리, 중환자 예측, 진료기록 작성 보조, 환자 분류와 같은 영역에서 AI 기반 도구가 이미 의료기관 안으로 들어오고 있습니다. 높은 의료 접근성, 상급종합병원 중심의 대규모 임상 데이터, 디지털 인프라, 빠른 기술 수용성은 한국 의료 AI의 강점입니다.
그러나 의료 AI의 진짜 과제는 도입 속도만으로 설명되지 않습니다. AI가 진료 효율을 높이는 도구로 확산될수록, 의료인의 판단이 어떻게 바뀌는지, 독립적 역량은 어떻게 유지되는지, 수련 과정에서 무엇이 형성되고 무엇이 생략되는지, AI가 틀리거나 중단되었을 때 의료 시스템이 어떻게 버틸 수 있는지를 함께 물어야 합니다.
즉 한국의 의료 AI 논의는 이제 "AI를 도입할 것인가"에서 "AI와 함께 일하는 의료인의 역량을 어떻게 지킬 것인가"로 이동해야 합니다. 한국 맥락에서 중요한 쟁점은 다섯 가지입니다.
쟁점 ① 제품 성능을 넘어, 사용자 영향 평가가 필요하다
지금까지 의료 AI 평가는 주로 제품의 성능에 집중해 왔습니다. 진단 정확도, 민감도, 특이도, 임상적 유용성, 알고리즘의 안정성은 당연히 중요합니다. 그러나 의료 AI가 실제 진료 흐름 안으로 들어오면 평가의 단위는 알고리즘만으로 충분하지 않습니다. AI를 사용하는 의사, 간호사, 약사, 의료기사의 판단이 어떻게 바뀌는지도 함께 보아야 합니다.
이 문제는 이미 국제적으로 현장의 관심사가 되고 있습니다. 미국 의사협회(AMA)가 1,692명의 의사를 대상으로 수행한 2026년 조사에서, 의사의 81%가 AI를 전문적으로 사용 중이며(2023년의 약 2배), 88%가 AI로 인한 임상 역량 저하(skill loss)를 어느 정도 우려한다고 응답했습니다. 특히 70%는 현재 수련 중인 의대생과 전공의의 역량 저하를 우려했고, 본인의 역량 저하를 우려하는 비율은 전체 28%였으나 경력 10년 이하의 초기 경력 의사에서는 35%로 더 높았습니다[22]. 2026년 Wolters Kluwer 조사에서도 5년 미만 경력의 신규 의료진이 deskilling을 상위 우려로 선택한 비율이 전체 평균보다 높았습니다[10]. 디지털 네이티브 세대의 의료진이 AI를 자연스럽게 수용하면서도, 자신의 역량 형성에 대해 더 민감하게 반응하고 있다는 신호입니다. 한편 Doximity의 2026년 보고서는 15개 진료과에 걸쳐 AI 사용과 관심이 빠르게 확산되고 있음을 보여주는 자료로, AI 사용 확산의 근거로 참고할 수 있습니다. 이 신호들은 한국의 정책 결정자가 주목해야 할 대목입니다.
국내 상황도 이 흐름과 무관하지 않습니다. 한국보건산업진흥원의 2025년 조사에서도 국내 의사들의 AI 사용 경험은 이미 상당한 수준으로 나타났고, 활용 영역은 영상 판독, 진단 보조, 질병 선별에 집중되어 있었습니다[24]. 동시에 법적 책임의 불명확성, 기관 내 가이드라인 부족, 교육 경험 부족이 주요 문제로 제기되었습니다[24]. 이는 한국의 의료 AI 논의가 단순한 기술 채택 단계를 넘어섰음을 보여줍니다.
앞으로 필요한 질문은 더 구체적이어야 합니다. 이는 한국의 의료 AI 논의가 단순한 기술 도입 단계를 넘어, 책임·교육·역량 유지의 문제로 이동해야 함을 보여줍니다. AI를 사용한 뒤 의사의 진단 정확도는 높아지는가. AI가 부정확할 때 의사는 그 오류를 알아차리는가. AI 권고를 수용하거나 거부한 근거가 기록되는가. AI 사용이 반복될수록 AI 없이 수행하는 기본 역량은 유지되는가. 이것이 의료 AI의 사용자 영향 평가입니다.
쟁점 ② AI 기본법은 출발점이지만, 의료인의 역량 유지까지 직접 다루지는 않는다
2026년 1월 22일 시행된 「인공지능 발전과 신뢰 기반 조성 등에 관한 기본법」, 즉 AI 기본법은 한국 의료 AI 거버넌스에 중요한 제도적 출발점을 제공합니다. 이 법은 인공지능의 발전을 촉진하는 동시에 안전성과 신뢰성을 확보하기 위한 기본 틀을 마련합니다. 의료 AI와 관련해 특히 중요한 부분은 고영향 인공지능에 관한 규율입니다.
AI 기본법은 사람의 생명·신체 안전 및 기본권에 중대한 영향을 미치거나 위험을 초래할 우려가 있는 인공지능을 고영향 인공지능으로 봅니다. 보건의료의 제공 및 이용체계, 의료기기와 디지털의료기기의 개발·이용 영역도 고영향 인공지능 판단과 관련된 영역에 포함됩니다. 다만 의료 분야에서 사용된다는 이유만으로 모든 의료 AI가 자동으로 고영향 인공지능이 되는 것은 아닙니다. 실제 사용 목적, 환자 안전에 미치는 영향, 기본권 침해 가능성, 의료인의 판단에 미치는 정도 등을 함께 고려해 판단해야 합니다.
고영향 인공지능에 해당할 경우, 사업자는 안전성·신뢰성 확보, 위험관리, 이용자 고지, 이용자 보호와 관련된 조치를 갖추어야 합니다. 고영향 인공지능을 이용한 제품이나 서비스에 대해서는 기본권에 미치는 영향을 평가하기 위한 노력도 요구됩니다. 이는 의료 AI가 단순한 소프트웨어 제품이 아니라, 환자 안전과 의료인의 판단에 영향을 미칠 수 있는 사회기술 시스템으로 다루어져야 한다는 점을 보여줍니다.
그러나 AI 기본법만으로 의료 AI의 de-skilling 문제가 해결되는 것은 아닙니다. AI 기본법은 고영향 AI 시스템을 어떻게 안전하고 신뢰할 수 있게 관리할 것인가에 초점을 둡니다. 반면 de-skilling 문제는 그 시스템을 사용하는 의료인의 판단 역량이 시간이 지나며 어떻게 변화하는가를 묻습니다. AI가 안전하게 설계되었더라도, 의료인이 장기간 AI에 의존하면서 AI의 오류를 식별하고, 필요할 때 거부하며, AI 없이도 핵심 판단을 수행할 능력을 유지하는지는 별도의 문제입니다.
따라서 의료 AI 거버넌스는 AI 기본법의 안전성·신뢰성 관리 틀에서 한 걸음 더 나아가야 합니다. 제품 차원에서는 디지털의료제품법과 식약처 인허가 체계가 성능과 안전성을 평가해야 합니다. 기관 차원에서는 의료기관이 AI 사용 교육, 사용 로그, 오류 대응 절차, 사후 모니터링 체계를 갖추어야 합니다. 전문직 차원에서는 대한의학회와 각 전문학회가 AI 없는 기본 역량과 AI 활용 역량을 함께 평가하는 수련 기준을 마련해야 합니다.
쟁점 ③ 인허가는 제품을 보지만, 임상 배치는 인간-AI 팀을 본다
식품의약품안전처는 인공지능 기반 디지털의료기기 허가·심사 가이드라인을 발전시켜 왔고, 생성형 AI 의료기기의 특성을 다루는 허가·심사 가이드라인도 마련했습니다. 디지털의료제품법은 디지털의료기기, 디지털융합의약품, 디지털의료건강지원기기 등 새로운 제품군을 포괄하는 규제 체계를 마련했다는 점에서 의미가 큽니다.
다만 인허가 단계의 질문과 임상 배치 단계의 질문은 다릅니다. 인허가 단계에서는 제품이 안전하고 유효한지, 성능이 적절한지, 임상적 유용성이 있는지를 봅니다. 그러나 실제 임상 배치 단계에서는 그 제품이 의료진의 판단 흐름 안에서 어떻게 작동하는지, 자동화 편향을 유발하지 않는지, 사용자의 독립적 판단을 약화시키지 않는지, 오류가 발생했을 때 누가 어떻게 대응하는지를 보아야 합니다.
따라서 의료 AI 관리는 "제품 성능 평가"에서 "인간-AI 팀 성능 평가"로 확장되어야 합니다. AI가 단독으로 얼마나 정확한가만 볼 것이 아니라, AI와 함께 일하는 의료진의 판단이 실제로 더 좋아지는가, AI가 틀렸을 때 의료진이 그 오류를 발견할 수 있는가, AI 없이도 핵심 판단을 수행할 수 있는가를 함께 평가해야 합니다.
이 관점은 시판 후 감시에도 반영되어야 합니다. 알고리즘 성능 저하나 데이터 드리프트만 추적할 것이 아니라, AI 권고 수용률, 오류 발견률, AI 비사용 상황의 대체 역량, 사용자 교육 이수와 실제 판단 변화까지 함께 모니터링하는 체계가 필요합니다.
쟁점 ④ 한국 의료 AI의 빠른 임상 진입과 추적 연구의 필요성
한국 의료 AI는 영상의학·내시경·병리 분야에서 빠른 속도로 임상에 진입하고 있습니다. 영상의학 분야에서는 루닛(Lunit INSIGHT CXR, MMG, DBT), 뷰노(뷰노메드 본에이지, 펀더스 AI, 딥브레인, 체스트 엑스레이, 딥카스 등), 코어라인소프트, 제이엘케이, 딥노이드, 메디컬에이아이 등 다수 기업이 식약처 인허가를 받은 제품을 상급종합병원과 검진센터에 공급하고 있습니다. 내시경 분야에서는 웨이센의 웨이메드 엔도(WAYMED Endo)가 국내 최초 AI 소화기 내시경 소프트웨어로 식약처 2·3등급 인허가와 제37호 혁신의료기기 지정을 획득하여 이대서울병원, 강남세브란스병원, 국민건강보험 일산병원, 강릉아산병원 등 다수 의료기관에서 사용되고 있습니다.
보건복지부와 건강보험심사평가원은 「혁신적 의료기술의 요양급여 여부 평가 가이드라인」을 2022년 개정하여 AI 기반 의료기술(영상의학·병리학)의 신의료기술 평가 경로를 정비했고, 루닛 인사이트 MMG는 평가 유예 신의료기술로 선정되었으며 뷰노메드 펀더스 AI는 혁신의료기기 통합심사·평가 승인을 받았습니다. AI 의료기기의 임상 진입을 지원하는 제도적 기반은 점진적으로 정비되고 있습니다.
다만 폴란드 ACCEPT 연구에서 확인된 내시경의 deskilling 현상[1]이 한국 임상 환경에서도 동일하게 나타나는지를 체계적으로 추적하는 국내 다기관 코호트 연구는 아직 보고되지 않았습니다. 한국이 의료 AI 임상 도입의 선도 국가 중 하나인 만큼, 이 추적 연구의 부재는 국제 학계에 기여할 수 있는 한국 데이터의 공백을 의미합니다. 보건복지부, 식약처, 의료 관련 학회, 그리고 의료기관이 협력하여 이러한 종단적 추적 체계를 구축할 필요가 있습니다.
쟁점 ⑤ AI 기본법·의료법·디지털의료제품법의 책임 분배 정합성
「의료법」 상 최종 진료기록 작성과 설명 책임은 의료인에게 귀속될 가능성이 큽니다. 그러나 AI 보조 환경에서 발생한 오류를 모두 의사 개인의 문제로만 설명하기는 어렵습니다. AI 개발사는 어떤 성능과 한계를 가진 제품을 만들었는가. 의료기관은 어떤 업무 흐름에 AI를 배치했는가. 사용자는 어떤 교육을 받았는가. 오류가 발생했을 때 로그와 근거는 남는가. 환자에게 AI 사용 사실과 한계는 어떻게 설명되었는가. 이 모든 요소가 책임 판단에 영향을 미칠 수 있습니다.
2024년 미국 의료면호위원회(FSMB)는 AI를 사용하는 의사가 AI 권고에 대해 적절히 대응하고, 그 판단 근거를 문서화해야 한다는 방향을 제시했습니다[16]. 반면 미국의사협회는 의사 개인에게만 책임을 집중시키기보다 개발사와 의료기관을 포함한 공동 책임의 필요성을 제기하고 있습니다. 이 논의는 한국에도 중요한 시사점을 줍니다.
의료 AI의 책임 구조는 "의사가 최종 책임자"라는 문장만으로 충분하지 않습니다. 제품 개발, 인허가, 기관 배치, 사용자 교육, 사후 모니터링, 진료기록 문서화가 함께 연결되어야 합니다. 특히 AI 사용이 의료인의 판단 역량 자체에 영향을 미칠 수 있다면, 책임 논의는 개별 오진 사건을 넘어 수련, 배치, 교육, 감독 등 시스템과 거버넌스 책임까지 포함해야 합니다.
종합. 의료 AI 거버넌스는 '제품'에서 '역량'으로 확장되어야 한다
의료 AI의 거버넌스는 더 이상 제품의 성능과 안전성만으로 충분하지 않습니다. 알고리즘이 얼마나 정확한가, 허가 기준을 충족했는가, 임상적 유용성이 입증되었는가는 여전히 중요합니다. 그러나 de-skilling과 never-skilling의 문제는 그 다음 질문을 요구합니다. 그 AI를 사용하는 의료인의 판단은 실제로 더 좋아지는가. 그리고 AI 없이도 핵심 판단을 수행할 수 있는가.
한국의 의료 AI 거버넌스는 이미 여러 제도적 축을 가지고 있습니다. AI 기본법은 안전성과 신뢰성의 큰 틀을 제시하고, 디지털의료제품법과 식약처 인허가 체계는 제품의 성능과 안전성을 평가합니다. 보건복지부와 건강보험심사평가원은 신의료기술 평가와 급여 판단을 담당하고, 의료기관은 실제 임상 배치를 결정합니다. 대한의학회와 각 전문학회는 수련과 전문직 역량의 기준을 마련합니다.
문제는 이 제도들이 대부분 각자의 목적에 따라 움직인다는 점입니다. AI de-skilling은 어느 한 기관의 관할만으로 해결되기 어렵습니다. 제품 인허가, 임상 배치, 사용자 교육, 수련 기준, 진료기록 문서화, 시판 후 모니터링이 서로 연결되어야 합니다. 의료 AI 시대의 거버넌스는 알고리즘을 관리하는 체계에서, 알고리즘과 함께 일하는 인간의 역량을 관리하는 체계로 확장되어야 합니다.
Wolters Kluwer가 2026년을 의료 AI 거버넌스의 해로 지목하면서 GenAI 확산과 임상 de-skilling 위험을 함께 언급한 것도 이 때문입니다[10]. 이제 필요한 것은 AI 도입 자체를 늦추는 것이 아니라, AI가 의료인의 판단을 어떻게 바꾸는지 추적하고, 필요한 역량이 사라지지 않도록 설계하는 것입니다.
07 의료 AI의 세 가지 가드레일
그렇다면 의료 AI의 de-skilling을 줄이기 위해 무엇을 해야 할까요. 현재의 연구와 규제 논의를 종합하면, 세 가지 가드레일이 필요합니다.
가드레일 ① AI-free baseline 평가의 제도화
의료기관과 수련 프로그램은 정기적으로 AI 없이 판독·감별진단·처방 검토를 수행하는 평가를 남겨야 합니다. 현재 의료 AI 평가는 '이 의사가 AI를 잘 활용하는가'에 집중되어 있습니다. 그러나 AI가 중단되거나 오류를 낼 때 의사가 독립적으로 판단할 수 있는가는 별개의 역량입니다.
따라서 의료기관과 수련 프로그램은 AI-free baseline 평가를 제도화할 필요가 있습니다. 이는 AI 사용을 금지하자는 뜻이 아닙니다. 오히려 AI를 안전하게 사용하기 위한 최소 조건입니다. AI가 중단되거나, 오류를 내거나, 적용 범위를 벗어난 상황에서도 환자 안전이 유지되려면, 의료인의 독립적 판단 기준점이 남아 있어야 합니다.
유럽영상의학회는 EU AI Act 시행 권고에서 AI 리터러시, 인적 통제, 자동화 편향 대응을 강조했으며, 이는 AI 사용 환경에서도 의료진의 지속 교육과 역량 유지가 필요하다는 전문 학회 차원의 신호로 해석할 수 있습니다[23].
가드레일 ② 인터페이스 설계의 전환
두 번째 가드레일은 AI를 어떻게 보여줄 것인가의 문제입니다. 같은 AI라도 어떤 순서와 방식으로 제시되는지에 따라 의료인의 판단은 달라질 수 있습니다. 항상 켜져 있고 먼저 답을 제시하는 AI는 편리하지만, 사용자의 1차 판단을 약화시키거나 자동화 편향을 키울 수 있습니다. 이를 줄이기 위한 설계는 몇 가지 방향으로 생각할 수 있습니다.
On-demand AI. AI 결과를 항상 자동으로 보여주는 것이 아니라, 의료인이 필요할 때 요청하도록 하는 방식입니다.
Sequential reveal. 의사의 독립 판단을 먼저 기록하게 한 뒤 AI 출력을 확인하게 하는 방식입니다. 의사의 추론 흔적이 시스템에 남게 되어 사후 평가와 교육에 활용 가능합니다.
Selective suppression 또는 calibrated alert. 오류 가능성이 높거나 신뢰도가 낮은 AI 출력은 그대로 제시하지 않고, 제한하거나 경고와 함께 보여주는 방식입니다. ACL MRI 연구에서 AI suppression 전략으로 자동화 편향이 41.7% 감소한 사례가 있습니다[4]. 이탈리아 영상의학 레지던트 연구에서 레지던트들이 AI 오류에 일정 수준 저항하는 모습을 보였다는 점[18]은, AI를 어떻게 배치하는가가 AI 자체보다 더 중요할 수 있다는 점을 시사합니다.
가드레일 ③ 시판 후 모니터링의 확장
세 번째 가드레일은 시판 후 모니터링의 범위를 확장하는 것입니다. 현재 의료 AI의 사후관리는 주로 제품의 성능 변화, 오류, 안전성 사건, 알고리즘 변경관리 등에 초점을 둡니다. 그러나 de-skilling의 관점에서는 여기에 사용자 변화가 포함되어야 합니다.
구체적 지표로는 ① AI 비사용 시 검출률·진단 정확도, ② AI 권고 수용률과 그 근거 문서화 비율, ③ AI 중단 시 대체 처리 능력, ④ 수련의의 독립 추론 점수의 시간적 변화 등이 가능합니다. 의료 AI 시판 후 감시의 단위는 더 이상 '알고리즘 단독'이 아닙니다. '알고리즘과 의료인이 이루는 팀'입니다.
이 세 가지 가드레일은 아직 한국에서 체계적으로 제도화되어 있다고 보기는 어렵습니다. 그러나 필요한 정책 도구는 이미 존재합니다. AI 기본법은 거버넌스의 큰 틀을, 디지털의료제품법과 식약처 인허가는 제품 평가의 틀을, 의료법은 진료 책임의 틀을, 전문학회 수련 기준은 역량 형성의 틀을 제공합니다. 남은 과제는 이 제도들을 의료 AI de-skilling이라는 하나의 문제의식 아래 연결하는 것입니다.
8 맺음말. AI를 반대하는 글이 아니다
이 글은 의료 AI를 반대하는 글이 아닙니다. 오히려 의료 AI가 중요해졌기 때문에 쓰는 글입니다. 의료 AI는 진료의 질을 높이고, 반복 업무를 줄이며, 의료진이 더 복잡한 판단에 집중하도록 도울 수 있습니다. 그러나 AI가 정확해질수록 의료인은 더 쉽게 의존하고, 의존이 깊어질수록 AI가 틀렸을 때 오류를 발견할 인간의 여지는 줄어들 수 있습니다. 그 순간 '인간이 최종 책임자'라는 문장은 법적 선언일 뿐, 실제 안전장치가 아닐 수 있습니다.
의료 AI 시대의 목표는 의사를 AI 이전으로 되돌리는 것이 아닙니다. 목표는 세 가지 능력을 동시에 갖춘 의료인을 기르는 것입니다.
첫째, AI 없이 핵심 판단을 수행할 수 있는 능력. 시스템 장애·중단·오류 시에도 환자 안전이 유지되어야 합니다.
둘째, AI와 함께 더 나은 판단을 할 수 있는 능력. AI 출력을 비판적으로 평가하고 자신의 임상 추론에 통합하는 인지적 기술입니다.
셋째, AI가 틀리거나 꺼졌을 때 시스템 전체가 무너지지 않게 하는 능력. 개인 역량을 넘어, 팀과 기관 차원의 회복탄력성입니다.
가장 좋은 의료 AI는 의사의 손을 대체하는 도구가 아닙니다. 의사가 무엇을 놓치고 있는지 알려주되, 동시에 의사가 무엇을 잊지 말아야 하는지 계속 확인하게 만드는 도구입니다. 의료 AI의 성공은 알고리즘이 얼마나 똑똑한가만으로 결정되지 않습니다. 그 알고리즘과 함께 일하는 의료인의 판단이 더 안전하고 더 책임 있게 유지되는가에 달려 있습니다.
9 사고실험(Thought Experiment): 여러분의 생각을 듣고 싶습니다.
아래 링크 또는 QR 코드를 스캔하시면, 이번 호에서 함께 다룰 사고실험의 구체적인 상황과 질문을 바로 확인하실 수 있습니다. 이번 주제에 대해 독자 여러분은 어떤 선택을 하셨는지, 그리고 그 근거는 무엇인지 소중한 의견을 들려주세요. 약 5분이면 충분합니다.
당신의 선택, 그리고 그 이유가 다음 호 〈제2회 · STEP B〉의 분석 재료가 됩니다.

https://forms.gle/T8Q54SWtBVoWD2nG6
① 아래 링크를 클릭하거나, QR 코드를 스캔해 주십시오.
② 소요 시간 약 5분 (7문항)
③ 익명 응답이며, 개인정보는 수집하지 않습니다
④ 설문 응답 마감은 6월 22일 (월) 까지
References
[1] Budzyń K, Romańczyk M, Kitala D, et al. Endoscopist deskilling risk after exposure to artificial intelligence in colonoscopy: a multicentre, observational study. Lancet Gastroenterol Hepatol. 2025;10(10):896-903. doi:10.1016/S2468-1253(25)00133-5. PMID:40816301.
[2] Ahmad OF. Endoscopist deskilling: an unintended consequence of AI-assisted colonoscopy? Lancet Gastroenterol Hepatol. 2025;10(10):872-873.
[3] Oettl FC, Pruneski J, Zsidai B, et al. From de-skilling to up-skilling: how artificial intelligence will augment the modern physician. J Exp Orthop. 2026;13(1). doi:10.1002/jeo2.70677. PMID:41783687.
[4] Wang DY, Ding J, Sun AL, Liu SG, Jiang D, Li N, Yu JK. Artificial intelligence suppression as a strategy to mitigate artificial intelligence automation bias. J Am Med Inform Assoc. 2023;30(10):1684-1692. doi:10.1093/jamia/ocad118. PMID:37561535.
[5] Abdulnour REE, Gin B, Boscardin CK. Educational strategies for clinical supervision of artificial intelligence use. N Engl J Med. 2025;393(8):786-797. doi:10.1056/NEJMra2503232. PMID:40834302.
[6] El Tarhouny S, Farghaly A. Deskilling dilemma: brain over automation. Front Med. 2026;13:1765692. doi:10.3389/fmed.2026.1765692. PMID:41709906.
[7] Natali C, Marconi L, Dias Duran LD, Cabitza F. AI-induced deskilling in medicine: a mixed-method review and research agenda for healthcare and beyond. Artif Intell Rev. 2025;58(11):356. doi:10.1007/s10462-025-11352-1.
[8] HCI Innovation Group. How Are Medical School Execs Thinking About Incorporating AI? Published November 20, 2025.
[9] Parasuraman R, Manzey DH. Complacency and bias in human use of automation: an attentional integration. Hum Factors. 2010;52(3):381-410.
[10] Wolters Kluwer Health. 2026 Healthcare AI Trends: Insights from Experts. Published December 15, 2025.
[11] Yu F, Moehring A, Banerjee O, Salz T, Agarwal N, Rajpurkar P. Heterogeneity and predictors of the effects of AI assistance on radiologists. Nat Med. 2024;30(3):837-849. doi:10.1038/s41591-024-02850-w. PMID:38504016.
[12] Goh E, Gallo R, Hom J, et al. Large language model influence on diagnostic reasoning: a randomized clinical trial. JAMA Netw Open. 2024;7(10). doi:10.1001/jamanetworkopen.2024.40969.
[13] Gaube S, Suresh H, Raue M, et al. Do as AI say: susceptibility in deployment of clinical decision-aids. npj Digit Med. 2021;4:31. doi:10.1038/s41746-021-00385-9.
[14] Goh E, Gallo RJ, Strong E, et al. GPT-4 assistance for improvement of physician performance on patient care tasks: a randomized controlled trial. Nat Med. 2025;31(4):1233-1238. doi:10.1038/s41591-024-03456-y. PMID:39910272.
[15] American Law Institute. Restatement of the Law Third, Torts: Medical Malpractice. Approved at the 2024 Annual Meeting. See also: Aaron DG, Robertson CT, King LP, Sage WM. A new legal standard for medical malpractice. JAMA. 2025;333(13):1161. doi:10.1001/jama.2025.0097.
[16] Federation of State Medical Boards. Navigating the Responsible and Ethical Incorporation of Artificial Intelligence into Clinical Practice. Adopted by the FSMB House of Delegates; April 2024.
[17] Lea AS. Cognitive aids, artificial intelligence, and deskilling in medicine: the history of an enduring anxiety. NEJM AI. 2026;3(1). doi:10.1056/AIp2500932.
[18] Savardi M, Signoroni A, Benini S, et al. Upskilling or deskilling? Measurable role of an AI-supported training for radiology residents: a lesson from the pandemic. Insights Imaging. 2025;16:23. doi:10.1186/s13244-024-01893-4. PMID:39881013.
[19] Qazi IA, Ali A, Khawaja AU, Akhtar MJ, Sheikh AZ, Alizai MH. Automation bias in large language model-assisted diagnostic reasoning among physicians trained in AI literacy: a randomized clinical trial. NEJM AI. 2026;3(5). doi:10.1056/AIoa2501001.
[20] Teng D, Tan L, Cao Q, et al. Impact of AI misinformation on diagnostic accuracy and confidence calibration in novice medical students. npj Digit Med. 2026;9:356. doi:10.1038/s41746-026-02547-z. PMID:41844809.
[21] Hwang G, Hejazian SS, Vafaei Sadr A, et al. Translating AI to the bedside with physician buy-in: recommendations from a meta-analysis and systematic review of the literature. Bioengineering (Basel). 2025;12(12):1363. doi:10.3390/bioengineering12121363. PMCID.
[22] American Medical Association. 2026 Physician Survey on Augmented Intelligence. AMA Center for Digital Health and AI; 2026.
[23] Kotter E, D'Antonoli TA, Cuocolo R, et al.; European Society of Radiology AI Working Group. Guiding AI in radiology: ESR's recommendations for effective implementation of the European AI Act. Insights Imaging. 2025;16:33. doi:10.1186/s13244-025-01905-x. PMCID.
[24] 한국보건산업진흥원. 의료 인공지능 활용 실태조사. 2026.
AI 도구 활용 고지
투명성을 위해 본 칼럼의 AI 활용 범위를 밝힙니다. 생성형 AI(Claude, Anthropic)는 두 가지 한정된 용도로만 사용되었습니다. 첫째, 필자가 직접 작성한 프롬프트와 구성 의도에 따른 대표 이미지의 시각적 구현. 둘째, 본문에 인용된 참고문헌의 서지정보와 사실관계를 교차 확인하는 보조 작업입니다. 칼럼의 주제 선정, 논지와 구조의 설계, 본문 집필, 그리고 모든 인용과 근거에 대한 최종 검토는 필자가 수행했으며, 글의 내용과 해석에 대한 책임은 전적으로 필자에게 있습니다.

- 최신순
- 추천순
댓글운영규칙ex) medi****** 아이디 앞 네자리 표기 이외 * 처리
댓글 삭제기준 다음의 경우 사전 통보없이 삭제하고 아이디 이용정지 또는 영구 가입이 제한될 수 있습니다.
1. 저작권・인격권 등 타인의 권리를 침해하는 경우
2. 상용프로그램의 등록과 게재, 배포를 안내하는 게시물
3. 타인 또는 제3자의 저작권 및 기타 권리를 침해한 내용을 담은 게시물
4. 욕설 및 비방, 음란성 댓글