IT/바이오

“AI가 영상까지 읽는다”…트웰브랩스, MCP 서버 공개로 멀티모달 시장 확장

박다해 기자
입력

트웰브랩스가 영상 이해에 특화된 인공지능 기술로 멀티모달 AI 시장 혁신에 박차를 가하고 있다. 트웰브랩스는 AI 에이전트가 영상 정보를 실시간으로 분석·요약·질의응답까지 수행하도록 지원하는 ‘모델 컨텍스트 프로토콜(MCP) 서버’를 공식 출시했다. 해당 기술은 엔드-투-엔드 기반으로 개발돼, 기존 텍스트나 이미지 중심의 AI 생태계를 영상까지 확장하는 데 파급력이 예상된다. 업계에서는 이번 발표가 “AI 어시스턴트 경쟁의 분수령”으로 작용할 것으로 본다.

 

트웰브랩스 MCP 서버는 앤트로픽이 제안한 오픈 표준 프로토콜을 기반으로 하며, 클로드 데스크톱 등 주요 AI 개발 플랫폼과의 연동을 표준화했다. 서버 상에는 자체 개발 멀티모달 영상 이해 모델 ‘마렝고’와 영상언어 생성 AI ‘페가수스’가 탑재돼 있다. 이 구성은 자연어로 영상 내 필요 장면을 검색하거나, 콘텐츠 자동 요약 및 다양한 질의응답을 제공하는 기능에서 기존 시스템 대비 정확도와 편의성을 높인 것이 특징이다. 예를 들면 기존 텍스트 인식 중심의 검색과 달리, MCP 서버는 영상 맥락 전체를 아우르는 질의 결과와 상황 분석을 동시 처리한다.

구체적으로 트웰브랩스 MCP 서버는 개발자가 플러그 앤 플레이 방식으로 즉시 도입할 수 있게 설계됐다. 개발자들은 자사 AI 앱에 마렝고의 영상 검색, 다단계 워크플로우 생성, 실시간 영상 탐색 등 고도화된 멀티모달 기능을 손쉽게 추가할 수 있어, 회의 영상 요약이나 창의적 영상 콘텐츠 생성 등 차세대 애플리케이션 개발의 진입장벽이 크게 낮아질 것으로 보인다.

 

글로벌 시장에서는 이미 구글, 오픈AI 등 주요 AI 기업이 멀티모달 모델을 핵심 전략으로 삼고 있으나, 트웰브랩스는 영상 이해력과 관련한 독자 기술 역량으로 국내외에서 차별화된 입지를 강화하는 중이다. 특히 텍스트, 이미지, 오디오 등 분리된 멀티모델 체계가 아닌, ‘단일 인터페이스’ 기반의 통합적 멀티모달 해석을 구현한 것은 경쟁 업체 대비 기술 완성도가 높은 것으로 평가된다.

 

한편 AI 영상 인텔리전스는 개인정보보호, 영상 데이터 규제 등 각국 정책 변수와도 밀접하게 맞물려 있다. 국내에서도 AI 관련 기술을 적용한 영상 데이터 활용 가이드라인이 논의 중이며, 글로벌 표준화 적용과 윤리 검증이 향후 상용화 확대의 관건이 될 전망이다.

 

이재성 트웰브랩스 대표는 단일 인터페이스 기반 영상 인텔리전스가 AI 산업의 새 미디어로 자리 잡을 것이라며 “MCP 서버 출시는 창업 초기부터 추구해온 진정한 멀티모달 구현의 결정체”라고 밝혔다. 산업계는 이번 기술의 실제 시장 안착과 글로벌 플랫폼간 생태계 주도권 재편에 주목하고 있다.

박다해 기자
share-band
밴드
URL복사
#트웰브랩스#mcp서버#마렝고