IT/바이오

“전문의·AI가 한 팀으로 판독”…루닛, 유방암 검출 효율 개선 입증

의료 인공지능 기술이 유방암 검진의 판독 방식과 위험도 평가 체계를 동시에 바꾸고 있다. 영상의학과 전문의와 AI가 함께 영상을 읽는 협업 구조가 기존 2인 이중판독보다 더 높은 침윤성 유방암 검출률을 보인 데다, 3차원 유방단층촬영 환경에서 병변 유형별 검출 특성을 세분화하는 연구도 나왔다. 유방의 체적 밀도 변화를 장기간 추적해 위험 예측 모델의 정밀도를 높이려는 시도까지 더해지면서, 업계에서는 유방암 검진 전 과정에서 AI가 핵심 도구로 부상하는 국면이라는 해석이 나온다.

루닛은 미국 시카고에서 열리는 2025 북미영상의학회에서 AI 의료영상 분석 솔루션 루닛 인사이트를 활용한 14편의 연구초록을 발표했다고 3일 밝혔다. 특히 스웨덴 카피오 세인트괴란 병원과 수행한 대규모 유방암 검진 연구에서 전문의 1인과 AI가 함께 판독하는 구조가 기존 전문의 2인 이중판독 방식보다 효율적이라는 결과가 제시돼 주목된다.

연구는 세인트괴란 병원에서 2020년 9월부터 2023년 6월까지 약 20만 건의 유방암 검진 데이터를 대상으로 AI 도입 전후 성과를 비교했다. 판독 방식은 세 가지로 구분했다. 영상의학과 전문의 2명이 AI 없이 판독한 경우가 2만 4770건, 전문의 2명이 유방촬영술 AI 솔루션 루닛 인사이트 MMG를 함께 활용한 경우가 11만 591건, 전문의 1명과 루닛 AI가 협업 판독을 수행한 경우가 5만 8462건이다.

분석 결과 전문의 1인과 AI가 협업 판독을 한 그룹에서 침윤성 유방암 검출률이 전문의 2인의 AI 미사용 이중판독 대비 0.29퍼센트에서 0.39퍼센트로 34.5퍼센트 늘어났다. 환자를 추가 검사나 진료로 불러들이는 비율을 뜻하는 리콜률은 2.62퍼센트에서 2.54퍼센트로 3.1퍼센트 감소했고, 실제 암이 맞을 확률을 의미하는 양성예측도는 16.6퍼센트에서 25.6퍼센트로 54.2퍼센트 향상됐다. 리콜률은 가장 낮으면서 양성예측도와 침윤성 유방암 검출률은 가장 높은 구성이라는 점에서 의료 인력 부담을 줄이면서도 검진 품질을 높이는 판독 모델로 평가된다.

유방단층촬영술 환경에서의 AI 성능을 세부적으로 분석한 결과도 공개됐다. 미국 메사추세츠 종합병원 연구팀은 3차원 유방단층촬영술인 DBT 영상 1000건을 대상으로 루닛 인사이트 DBT를 적용해 검출 특성을 살폈다. 이 솔루션은 최종적으로 유방암으로 확인된 334건 가운데 84.4퍼센트인 282건을 정확히 찾아냈고 병변 위치까지 올바르게 특정했다. 병변 유형별로 보면 AI가 암을 찾아낸 사례에서는 종괴형 병변 비중이 42.9퍼센트, 침윤성 유관암 비중이 61.0퍼센트로 높게 나타난 반면, 놓친 사례에서는 석회화 병변이 59.6퍼센트, 비침윤성 상피내암이 51.9퍼센트를 차지했다.

루닛은 이 결과가 AI가 강점을 보이는 병변 유형과 추가 성능 개선이 필요한 영역을 동시에 드러낸다고 평가했다. 특히 석회화 병변과 비침윤성 상피내암처럼 조기 발견 관점에서 중요성이 큰 병변에서의 한계가 드러난 만큼, 알고리즘 구조와 학습 데이터 구성을 이 방향으로 보완하는 전략이 향후 개발 로드맵의 핵심 기준이 될 수 있다는 분석이다. 실제 임상에서는 어떤 병원, 어떤 환자군에 AI를 우선 적용할지 판단하는 근거로도 활용될 수 있다.

유방의 체적 밀도를 활용한 장기 위험도 평가 연구도 병행됐다. 미국 엘리자베스 웬드 유방암 클리닉 연구팀은 루닛 인터내셔널의 리스크와 덴서티 제품을 적용해 유방 체적 밀도가 유방암 고위험군 선정과 예측 신뢰도에 미치는 영향을 분석했다. 체적 밀도는 유방 내 섬유선 조직 비율을 정량화한 지표로, 영상 판독 난이도뿐만 아니라 발병 위험 인자로도 다뤄진다.

첫 번째 연구에서 연구팀은 4만 4651명 검진 데이터를 활용해 체적 밀도 값을 대표적 위험 예측 모델인 타이러 쿠직과 보아디시아에 각각 대입했다. 비교 결과 타이러 쿠직 모델이 보아디시아보다 유방 체적 밀도와 가족력 요소를 더 크게 반영해 더 많은 여성을 고위험군으로 분류하는 경향이 관찰됐다. 동일한 기초 데이터라도 어떤 수학적 모델이 체적 밀도 값을 어떻게 가중하느냐에 따라 고위험군 규모와 구성이 달라질 수 있다는 의미다.

두 번째 연구에서는 33만여 건의 유방촬영 영상을 사용해 시간에 따른 유방 체적 밀도 변화와 발병 위험도 사이의 상관관계를 평가했다. 단일 시점의 밀도 값과 영상 판독 범주 체계를 뜻하는 BI-RADS만 활용한 경우 실제 암 발생 건수를 낮게 추정하는 경향이 나타났다. 반면 여러 시점의 검진 데이터를 결합해 장기 평균 유방 밀도를 반영했을 때는 예측치와 실제 발생 건수가 가장 근접해 모델의 신뢰도가 높아졌다. 유방 밀도가 단순 보조 지표가 아니라 종단적 위험 평가의 핵심 변수로 기능할 수 있다는 해석이 가능하다.

연구 결과들은 유방암 검진 패러다임에서 AI의 역할이 단일 판독 보조를 넘어 인력 구성, 촬영 모달리티별 전략, 장기 위험 평가까지 포괄하는 수준으로 확장되고 있음을 보여준다. 인력 부족이 심화되는 국가에서는 전문의 1인과 AI가 협업하는 판독 체계를 도입해 검진 효율을 높일 수 있고, DBT 영상이 빠르게 확산되는 시장에서는 병변 유형별 AI 성능을 면밀히 파악해 임상 적용 프로토콜을 세분화할 수 있다. 체적 밀도 기반 장기 위험 평가 기술은 선별검사 주기 조정이나 맞춤형 추적검사 전략 설계에 활용될 여지도 있다.

글로벌 시장에서는 유럽과 북미를 중심으로 유방암 검진에서의 AI 도입과 규제 논의가 병행되는 상황이다. 미국과 유럽 규제당국은 AI 기반 영상의료기기에 대해 안전성과 유효성을 입증하는 임상 데이터를 요구하고 있으며, 실제 임상 현장에서는 판독 책임 소재와 오판에 따른 법적 리스크를 어떻게 배분할지에 대한 논의도 이어지고 있다. 이런 환경에서 RSNA 같은 국제 학회에서 축적되는 대규모 실제 검진 데이터 기반 연구는 규제 승인과 보험 수가 논의에서 중요한 참고 자료로 활용될 가능성이 크다.

업계 전문가들 사이에서는 AI가 유방암 검진 인력 구조 개편과 진료 프로세스 재설계를 촉진할 수 있다는 전망도 나온다. 검진 단계에서는 전문의 1인 플러스 AI 구조가 보편화되고, 고위험군 선별과 추적검사 계획 수립에는 체적 밀도와 종단적 위험 평가 모델이 결합되는 방향으로 재편될 수 있다는 관측이다. 반면 유방암 사망률 감소 효과를 객관적으로 입증하려면 장기간 추적 관찰 연구와 국가 단위 데이터 연계가 필요하다는 지적도 제기된다.

서범석 루닛 대표는 유방암 검진 정확도 향상, DBT 기반 병변 특성별 검출력 분석, 밀도 분석을 통한 위험도 예측에 이르기까지 유방암 관리 전 주기에서 AI의 기여 가능성이 확인됐다고 강조했다. 그는 글로벌 학회에서의 검증을 바탕으로 미국을 포함한 주요 국가 유방암 검진 시스템에서 AI 기반 판독과 위험도 예측이 새로운 표준으로 자리 잡을 수 있도록 기술 고도화와 임상 근거 축적을 병행해 나가겠다고 밝혔다. 산업계는 이번 연구에서 제시된 협업 판독 모델과 장기 위험 평가 접근법이 실제 국가 검진 체계에 안착할 수 있을지 주시하고 있다.

송다인 기자

[email protected]

밴드

URL복사

#루닛#루닛인사이트#유방암검진