“AI로 객실 정보 딱 맞춘다”…온다, 숙박업 매칭 정확도 96.5% 달성
호스피탈리티 인공지능(AI) 기업 온다가 숙박업 특화 멀티모달 AI 모델을 공개하며 객실 정보 매칭 정확도 96.5%를 달성했다. 이번 기술은 온라인여행사 등 숙박 유통 플랫폼이 직면한 ‘객실 데이터 불일치’ 문제를 근본적으로 해소할 수 있는 실질적 해법으로 평가받고 있다. 숙박 플랫폼 시장에서는 공급사별로 표기 방식이 상이한 객실 데이터를 일관성 있게 관리하는 것이 운영 효율성과 직결돼 있어, 업계 관계자들은 이번 발표를 ‘도메인 AI 경쟁의 변곡점’으로 꼽는다.
온다가 허깅페이스를 통해 공개한 AI 모델은 8000여 장의 자체 구축 객실 이미지 데이터와 한국어 특화 자연어처리 기술을 융합한 하이브리드 구조다. 구체적으로는 비전 트랜스포머(ViT) 기반의 이미지 분류 모델과 한국어 언어모델(KLUE BERT)을 결합, 서로 다른 사업자가 제공하는 객실 정보를 자동 표준화해 기존 대비 높은 매칭 정밀도를 확보했다. 단일 이미지를 기준으로는 구분이 어려운 뷰 타입 분류 등 엣지 케이스(edge case)에서도 앙상블(모델 출력값 가중 융합) 기법으로 정확도를 유지했다. 실제 테스트에서 매칭 정확도는 96.5%에 도달해, 기존 숙박 플랫폼의 수작업 기반 매칭 방식보다 월등한 성능을 나타냈다.

이 기술은 OTA, 호텔 체인 등 숙박 플랫폼이 각 공급사로부터 중복·누락 위험이 높은 객실 데이터를 취합할 때 자동 표준화·중복 제거를 실현한다. 객실명, 침대 타입, 전망, 서비스 조건 등 객실 속성에 특화된 자연어 처리와 이미지 인식 기능을 결합해, 실제 고객과 파트너사의 혼선을 줄이는 실효적 방안으로 주목받는다.
글로벌 AI 업계에서도 도메인 특화 하이브리드 모델이 실무에 적용되는 사례는 많지 않다. 미국·유럽계 OTA들도 유사한 데이터 불일치 문제를 겪고 있으나, 한국 숙박업 특유의 복잡한 표기 방식에 맞춘 현지화 AI의 대규모 상용 사례로서는 온다가 처음이다. 특히 온다는 AI의 신뢰도를 산출하고, 기준 이하 결과에는 도메인 전문가가 후검증에 참여하는 하이브리드 워크플로우를 도입해 실제 운영 환경에서 높은 신뢰성과 안정성을 확보하는 데 중점을 뒀다.
이 AI 모델은 재고·가격 자동 태깅, 어메니티 자동 인식 등 숙박 산업에 필요한 다양한 자동화 업무로 확장될 전망이다. 온다는 3만7000개 숙박업소, 71개 유통 채널 실거래 데이터 등 독보적 자산을 바탕으로, 향후 빅데이터 AI 플랫폼 선도 사업자로 도약하겠다는 전략이다. 국내외 데이터와 AI 결합 사업이 본격화되는 현실에서, 온다처럼 실제 서비스 적용 능력과 지방색이 반영된 모델 설계가 차별화 요소가 될 것이라는 분석도 나온다.
한편, 플랫폼 AI의 상용화에 따라 개인정보보호, 표준화 지침 등 제도적 뒷받침과 함께, 객실 등급·속성 분류에 대한 업계 공통 기준 정립도 요구되고 있다. 숙박 IT 업계는 데이터 일치 기반의 예약 경험이 안정적으로 제공될지 지켜보고 있다.
