IT/바이오

유전체 해석 AI로 글로벌 최상위권…쓰리빌리언, CAGI7서 기술력 입증

조수빈 기자
입력

유전체 해석 인공지능이 희귀질환 진단을 넘어 정밀의료와 신약 개발의 패러다임을 바꾸는 계기를 마련하고 있다. 국내 희귀질환 진단 기업 쓰리빌리언이 미국 보스턴에서 열린 유전체 해석 AI 국제 평가 대회 CAGI7에서 최우수팀에 선정되며 기술력을 입증했다. 업계에서는 글로벌 연구진이 동일 조건에서 겨루는 블라인드 평가에서 세계 최고 수준 성능을 확인한 만큼, 국내 유전체 AI 기술이 후보물질 발굴과 변이 기반 타깃 선정 경쟁의 분기점을 맞이했다는 분석이 나온다.  

 

쓰리빌리언은 6일부터 8일까지 미국 보스턴에서 열린 CAGI7 컨퍼런스에서 FGFR 변이 기능 예측 챌린지 최우수팀으로 선정돼 성과를 발표했다고 15일 밝혔다. CAGI는 미국 국립보건원과 UC버클리가 주관하는 유전체 해석 AI 국제 평가 대회로, 참가팀이 제출한 예측 결과를 실제 실험 데이터와 비교해 유전변이가 질환 또는 단백질 기능에 미치는 영향을 얼마나 정확하게 맞추는지 블라인드 방식으로 검증한다. 학계와 산업계는 이 대회를 유전체 해석 AI 성능을 객관적으로 비교하는 국제 벤치마크로 활용하고 있다.  

쓰리빌리언이 최우수팀으로 선정된 FGFR 변이 기능 예측 챌린지는 FGFR1부터 FGFR4까지 4개 유전자에서 발생 가능한 모든 미스센스 변이, 즉 아미노산 치환이 단백질 기능에 어떤 변화를 주는지를 예측하는 고난도 과제였다. FGFR 계열 유전자는 다양한 암과 희귀질환과 연관된 것으로 알려져 있으나, 이번 과제의 초점은 특정 질환 진단이 아니라 개별 변이가 단백질 기능을 얼마나 강화하거나 떨어뜨리는지, 그리고 그에 따라 약물 반응성이 어떻게 달라지는지를 정량적으로 예측하는 능력에 맞춰졌다. 실제 임상과 연구 현장에서는 같은 유전자라도 변이 위치와 종류에 따라 완전히 다른 기능적 영향을 보이기 때문에, 이러한 차이를 구분해 내는 정밀도가 변이 해석 기술 경쟁의 핵심으로 여겨진다.  

 

쓰리빌리언은 멀티태스크 러닝을 적용한 타깃 임베딩 공간 최적화 AI 모델 클리어베리언트프로를 개발해 이번 FGFR 과제에 출전했다. 멀티태스크 러닝은 하나의 모델이 여러 관련 과제를 동시에 학습해 공통 패턴을 더 잘 포착하게 하는 기계학습 기법으로, 쓰리빌리언은 이를 통해 변이의 기능 변화, 약물 반응성, 단백질 구조와 같은 다양한 정보를 하나의 임베딩 공간에 통합해 표현하도록 설계했다. 이 구조를 기반으로 클리어베리언트프로는 FGFR 계열 변이의 기능 강화와 기능 손실, 그리고 약물 반응성 변화를 함께 예측하는 모델로 구현됐다.  

 

이번 평가에는 구글 딥마인드 계열이 개발한 알파미스센스를 비롯해 메타가 공개한 단백질 언어모델 ESM 기반 예측, 그리고 여러 국제 연구팀이 제출한 모델 결과가 함께 비교됐다. CAGI 운영진은 동일한 변이 목록에 대해 각 팀이 사전에 예측값을 제출하도록 한 뒤, 컨퍼런스 현장에서 숨겨져 있던 실제 실험 결과와 대조해 성능을 검증했다. 특히 이번 FGFR 과제는 변이별 기능 변화가 증폭 방향과 감소 방향으로 복합적으로 나타나는 데이터셋이어서, 한쪽 방향에 특화된 모델은 정확도가 떨어질 수밖에 없는 구조였다.  

 

평가는 약물유전체학 분야의 최고 권위자로 꼽히는 스탠퍼드대학교 러스 알트먼 교수팀이 담당했다. 평가 결과 클리어베리언트프로는 참가팀 중 유일하게 기능 강화와 기능 손실 두 방향의 기능 변화를 모두 높은 정밀도로 예측했을 뿐 아니라, 약물 반응성 변화까지 동시에 우수한 성능을 보여 FGFR 과제 최우수 모델로 선정됐다. 알파미스센스는 기능 손실 예측에서는 상위권 성능을 기록했지만, 기능 강화 예측에서는 최하위권에 그친 것으로 나타나 방향성 편향을 드러냈고, 메타 ESM 기반 모델 역시 특정 영역에 강점이 있으나 전체 영역에서는 클리어베리언트프로에 미치지 못한 것으로 평가됐다.  

 

업계에서는 이번 결과가 변이 해석 AI의 경쟁 구도가 단순한 병적 변이 예측 정확도를 넘어서, 구조와 기능, 약물 반응까지 통합적으로 다루는 다차원 예측 능력으로 옮겨가고 있음을 보여주는 지표로 보고 있다. 미국과 유럽에서는 유전체 기반 정밀의료 프로젝트를 중심으로 유전변이 데이터와 임상 결과를 결합한 대형 코호트 구축이 진행 중이며, 이러한 데이터는 글로벌 빅테크와 바이오테크의 AI 모델 학습에 적극 활용되고 있다. 구글, 메타 등 기술 기업은 단백질 구조와 변이 효과 예측의 기초 모델을 앞세우고 있고, 리커전, 인실리코메디슨 등 AI 신약개발 기업들은 화합물 반응 예측과 병합해 후보물질 탐색 플랫폼을 고도화하는 중이다. 쓰리빌리언이 이번 CAGI7에서 알파미스센스보다 앞선 성능을 보여준 만큼, 국내 기업이 이 경쟁 구도에서 존재감을 확대할 가능성도 제기된다.  

 

정책·규제 측면에서는 이번 성과가 희귀질환 진단 고도화 뿐 아니라, 변이 기반 표적 치료제 개발과 약물 반응 예측 등으로 적용 영역을 넓힐 때 새로운 논의가 필요하다는 목소리도 나온다. 실제로 미국 식품의약국과 유럽 규제당국은 유전체 정보와 AI 예측을 임상시험 설계나 약물 반응 서브그룹 분석에 활용하는 방안을 단계적으로 검토하고 있다. 아직까지 AI 예측만으로 규제 결정이 내려지는 수준은 아니지만, 고난도 국제 벤치마크에서 입증된 모델 성능이 축적될 경우 정밀의료와 신약개발 규제 프레임에도 영향을 줄 수 있다는 관측이 나온다.  

 

쓰리빌리언은 이번 FGFR 과제 외에도 CAGI7에서 여러 챌린지에 참여해 우수한 성과를 거둔 것으로 알려졌다. 회사는 클리어베리언트프로를 자사 희귀질환 진단 서비스에 우선 적용해 변이 해석 정확도를 높이는 한편, 제약사와 협업해 변이 기반 타깃 발굴과 단백질 기능 분석, 약물 반응성 예측 등 신약개발 지원 플랫폼으로 확장하는 전략을 검토 중이다. 금창원 대표는 CAGI를 유전체 해석 AI를 동일 조건에서 평가하는 국제적 기준이라고 강조하며, 이번 최우수팀 선정이 쓰리빌리언의 변이 해석 기술이 세계 최고 수준임을 재확인한 계기라고 말했다. 그는 희귀질환 진단 고도화와 함께 변이 기반 정밀의료와 신약 개발로 기술 적용 범위를 넓혀가겠다고 덧붙였다.  

 

산업계는 쓰리빌리언의 이번 성과가 실제 임상 현장과 제약 개발 파이프라인에 얼마나 빠르게 통합될지, 그리고 국내 유전체 데이터와 결합해 글로벌 정밀의료 시장에서 어떤 위치를 차지하게 될지에 주목하고 있다. 기술과 규제, 의료 현장의 수용성이 맞물리는 속도가 향후 경쟁 구도를 가를 핵심 변수로 거론된다.

조수빈 기자
share-band
밴드
URL복사
#쓰리빌리언#cagi7#clearvariantpro