IT/바이오

"LLM이 희귀질환 논문도 읽는다"…쓰리빌리언, 변이해석 자동화로 진단 혁신

거대언어모델 기반 유전변이 해석 기술이 희귀질환 정밀진단 패러다임을 바꾸고 있다. 인공지능 기반 희귀유전질환 진단 기업 쓰리빌리언이 대형 언어모델을 활용해 유전체 변이의 임상적 의미를 자동으로 해석하는 시스템을 선보이며, 급증하는 의학 논문 데이터를 실시간으로 진단에 연결하는 시도를 본격화했다. 업계에서는 이번 성과를 희귀질환 진단 경쟁과 더불어 AI 신약개발용 근거 데이터 확보 경쟁의 분기점으로 보고 있다.

쓰리빌리언은 24일 임상유전체연구팀 문동석 박사가 20일 열린 2025 대한의학유전학회 추계학술대회에서 발표한 AIVARI 연구가 우수구연상을 수상했다고 밝혔다. AIVARI는 AI 기반 변이 해석 시스템으로, 정식 명칭은 AI VARiant Interpreter다. 논문과 데이터베이스에 흩어져 있는 유전변이 관련 근거를 대형 언어모델이 자동으로 읽고 정리해 주는 것을 목표로 한다.

유전변이 해석의 국제 표준으로 통용되는 미국임상유전학회 ACMG 가이드라인은 변이를 병원성, 양성, 불확실 변이 등으로 분류하기 위해 다섯 가지 범주의 근거를 요구한다. 기존에는 임상유전학자와 의료진이 각종 논문, 증례 보고, 공개 데이터베이스를 일일이 검색해 해당 변이에 대한 기능 연구 결과, 가족력 정보, 빈도 정보 등을 수작업으로 수집해야 했다. 진단 환자 수가 늘고, 매년 새로 출판되는 관련 논문만 10만 편을 넘어서면서 이 과정이 희귀질환 진단의 최대 병목으로 지적돼 왔다.

AIVARI의 핵심은 최신 거대언어모델을 변이 해석 워크플로에 맞게 튜닝해 방대한 텍스트에서 변이 관련 근거를 자동 추출하도록 설계한 점이다. 시스템은 유전변이와 질환 키워드에 대응되는 논문을 탐색한 뒤, 본문 문맥을 기반으로 병원성 판정에 필요한 요소를 구조화된 데이터로 변환한다. 이를 통해 ACMG 가이드라인 각 기준의 충족 여부를 89.6퍼센트 정밀도로 판별하는 성능을 확보했다.

특히 기존 규칙 기반 검색 시스템이 제목이나 초록에 명시된 키워드 중심으로만 정보를 찾는 데 그쳤다면, AIVARI는 본문 깊숙한 문단에 산재한 실험 설계, 환자 수, 기능 저하 여부 등 세부 근거까지 문맥 단위로 해석한다. 변이명 표기 방식이 논문마다 다르게 쓰이는 문제나, 약어와 동의어가 혼재한 환경에서도 의미를 추론해 연결할 수 있어 수작업 큐레이션 대비 누락과 휴먼 에러를 크게 줄였다는 평가다.

연구진은 AIVARI가 고처리량 분석, 즉 별도의 변이 정보를 일일이 입력하지 않아도 문헌에서 유효 데이터를 대량으로 추출해낼 수 있도록 설계됐다고 설명한다. 특정 유전자군에 대한 변이 리스트 전체를 대상으로 관련 근거를 동시에 스캔하고, 이를 대규모 변이 데이터베이스로 축적하는 방식이다. 쓰리빌리언은 이 데이터베이스를 자사 희귀질환 유전진단 솔루션에 통합해 판독 보고서 생성 속도와 정확도를 높일 계획이다.

문동석 쓰리빌리언 임상유전체연구원은 AIVARI가 변이 해석 과정의 가장 시간이 많이 드는 문헌 큐레이션 구간을 AI가 대신 수행해 주는 역할을 한다고 설명했다. 의료진 입장에서는 동일한 인력으로 더 많은 환자를 신속하게 판독할 수 있고, 최신 논문 반영이 어려웠던 복잡 희귀질환에서도 진단 일관성이 개선될 수 있다는 기대가 나온다. 국내 병원들이 정밀유전체검사 수요 증가로 인력 부담을 호소해 온 만큼 실제 진료 현장 수용성도 높을 것으로 보인다.

글로벌 시장에서는 이미 유전체 기반 정밀의료와 AI 지원 변이 해석 경쟁이 본격화된 상황이다. 미국과 유럽의 주요 유전체 분석 기업들은 규칙 기반 판독 엔진에 기계학습을 결합해 진단 속도를 높이는 전략을 펴고 있으나, 대형 언어모델을 전면에 내세워 문헌 근거 수집 자체를 자동화한 사례는 아직 초기 단계다. 쓰리빌리언이 국내 학계에서 성능을 인정받은 만큼, 해외 임상 유전체 센터와의 협업이나 공동 검증 연구로 외연을 넓힐 여지도 있다.

AIVARI의 영향은 희귀질환 진단을 넘어 신약개발 분야로도 확장될 수 있다. 유전변이와 질환, 약물 반응을 연결하는 근거 논문을 체계적으로 수집하면 신약 타깃 발굴, 작용기전 규명, 바이오마커 후보 선별 등에 필요한 기초 데이터를 빠르게 확보할 수 있기 때문이다. 실제로 글로벌 제약사들은 딥러닝 기반 구조 예측과 가상 스크리닝뿐 아니라 텍스트 기반 문헌 마이닝을 신약 파이프라인 전 과정에 도입하고 있어, 문헌 해석 정확도가 경쟁력의 핵심 요소가 되고 있다.

규제와 제도 측면에서는 AI 기반 해석 결과를 임상 진단과 의사결정에 어느 수준까지 반영할 수 있을지가 관건으로 떠오르고 있다. 국내외 규제기관은 현재까지 AI 시스템을 의료기기 소프트웨어로 분류해 검증된 알고리즘과 데이터셋 기반 성능 평가를 요구해 왔다. 대형 언어모델처럼 학습 범위가 광범위하고 업데이트가 빈번한 기술에 대해서는 버전 관리, 추론 과정 설명 가능성, 편향 검증에 대한 추가 기준이 필요하다는 지적도 제기된다.

금창원 쓰리빌리언 대표는 의학 논문이 희귀질환 진단뿐 아니라 신약 타깃 발굴과 메커니즘 규명에도 핵심 자원이라며, AIVARI를 자사 진단 서비스와 유전변이 해석 서비스형 소프트웨어 지브라, AI 신약개발 전 영역에 연계해 근거 데이터 확보 역량을 강화하겠다고 밝혔다. 실제로 클라우드 기반 SaaS 형태로 변이 해석 기능을 제공할 경우, 국내외 병원과 연구기관이 동일한 기준과 근거에 기반해 유전체 데이터를 해석하는 생태계가 형성될 가능성도 있다.

전문가들은 유전체 데이터 생산 속도보다 해석 역량이 더 큰 병목으로 부각되는 상황에서, AI 기반 문헌 해석 기술이 정밀의료 인프라의 필수 요소가 될 수 있다고 본다. 다만 고도화된 자동화 시스템을 도입하더라도 최종 임상 판단은 여전히 전문가의 검증과 책임을 전제로 해야 한다는 점에서, AI와 의료진 간 역할 분담과 책임 구조에 대한 논의가 병행돼야 한다는 목소리도 나온다. 산업계는 이번 기술이 희귀질환 진단과 AI 신약개발 현장에서 실제 표준 도구로 자리 잡을 수 있을지 예의주시하고 있다.

박다해 기자

[email protected]

밴드

URL복사

#쓰리빌리언#aivari#gebra