IT/바이오

“온디바이스도 서버에 저장”…AI통화비서, 보안 불신 확산

최동현 기자
입력

AI 기반 통화 요약 서비스가 이동통신·플랫폼 업계의 새 먹거리로 부상한 가운데, 데이터 보관과 처리 구조에 대한 불신이 커지고 있다. LG유플러스의 온디바이스 AI 통화 비서 익시오에서 타인의 통화 요약 정보가 노출되면서, 유사 서비스를 운영 중인 SK텔레콤 에이닷과 카카오 보이스톡까지 보안·프라이버시 리스크 검증 대상이 되고 있다. 업계는 음성 AI 서비스 경쟁이 본격화된 지금이 통신·클라우드 인프라의 보안 수준과 개인정보 설계 원칙을 다시 점검해야 할 분기점으로 보고 있다.

 

LG유플러스에 따르면 익시오에서는 2일 저녁 8시부터 3일 오전 10시 59분까지 약 15시간 동안 타인 정보가 일부 이용자 화면에 노출됐다. 이 시간대에 익시오를 신규 설치하거나 재설치한 이용자 101명이 피해 대상이 됐으며, 타인 36명의 통화 요약 내용과 상대방 전화번호, 통화 시각 등이 표시됐다. 회사는 내부 개발자가 임시저장공간인 캐시를 잘못 설정해 서버에 남아 있던 요약 데이터가 다른 이용자에게 전달됐다고 설명했으며, 사고 후 즉각 조치와 함께 개인정보보호위원회에 신고했다.

익시오는 그동안 통화 녹음과 음성의 텍스트 변환을 스마트폰 등 단말기 내부에서 처리하는 온디바이스 AI 구조를 강점으로 내세워 왔다. 음성 인식과 자연어 처리 모델을 기기 안에 탑재해 외부 서버로 원본 음성을 보내지 않는 만큼, 전송 구간 해킹이나 대규모 유출 위험을 낮출 수 있다는 논리다. 다만 이번 사고는 온디바이스 구조라고 해도 결과 데이터의 보관 방식에 따라 보안 수준이 크게 달라질 수 있음을 보여준 사례로 받아들여지고 있다.

 

문제는 이용 편의성을 위한 추가 기능에 있었다. LG유플러스는 기기 변경이나 앱 재설치 후에도 이전 통화 요약을 이어볼 수 있도록 하는 이른바 이어하기 기능을 위해, 통화 요약 결과물을 서버에 최대 6개월간 보관해 왔다. 원본 녹음과 1차 텍스트 변환은 단말 내부에서 끝냈지만, 최종 요약본을 서버에 쌓는 과정에서 캐시 관리 오류가 발생했다는 설명이다. 회사는 보존 기간과 저장 방식, 권한 관리 절차 전반을 재설계하는 방안을 검토 중인 것으로 알려졌다.

 

이번 사고로 시선은 자연스럽게 경쟁 서비스인 SK텔레콤 에이닷으로 옮겨가고 있다. 에이닷은 국내 통신사 AI 비서 가운데 가장 큰 규모로, 월간 활성 이용자 수가 1000만명을 넘는 것으로 알려져 있다. 통화 요약, 일정 관리, 추천 콘텐츠 등 다양한 기능을 제공하는 만큼 통화 데이터를 포함한 개인 데이터가 어떤 구조로 수집·처리·보관되는지에 대한 관심이 높다.

 

에이닷의 통화 요약 서비스는 익시오와 달리 온디바이스가 아니라 서버 중심 구조다. 통화가 끝나면 음성 파일이 SK텔레콤 서버로 전송되고, 이곳에서 음성을 텍스트로 변환한 뒤, 요약은 마이크로소프트 클라우드 환경에서 생성되는 다단계 구조를 갖는다. 전송 구간과 서버 측 처리가 모두 포함되는 만큼, 네트워크 침해나 계정 탈취, 운영자 권한 남용 등 잠재 리스크에 대한 우려도 나온다.

 

SK텔레콤은 강도 높은 암호화와 최소 보관 정책을 적용하고 있다고 강조한다. 회사 설명에 따르면 에이닷은 캐시 서버를 운영하지 않고, 사용자 단말 기반 공개키로 암호화된 채 서버로 전송된 음성 데이터가 텍스트 변환을 마치면 곧바로 음성 원본과 텍스트 파일을 삭제한다. 실제로 서버에 남는 것은 요약 결과뿐이며, 이 요약본을 기능 제공과 운영을 위해 180일간 보관한다는 입장이다. 서버 저장소는 암호화돼 있고, 운영 인력 접근 권한도 분리 관리한다는 설명을 덧붙였다.

 

에이닷의 개인정보 처리방침에는 통화 중 언급된 계좌번호, 주소, 일정 등 민감 정보 패턴을 수집·저장할 수 있다는 항목도 포함돼 있다. 이 부분은 AI 모델 학습과 오탐지 방지 목적이라는 설명에도 불구하고, 이용자 입장에서는 실제 민감 정보가 어디까지 남는지 판단하기 쉽지 않다는 점에서 논란이 될 소지가 있다.

 

SK텔레콤은 이에 대해 민감 정보는 원문 그대로 저장하지 않고 패턴 형태로 비식별화해 보관하며, 원문 텍스트는 즉시 삭제된다고 해명했다. 예를 들어 계좌번호 형식, 주소의 구조 등만 남겨 모델이 해당 패턴을 인식하고 필터링할 수 있도록 하고, 실제 숫자나 문구는 서버에 남기지 않는 구조라는 설명이다. 회사는 이 데이터가 암호화된 환경에서 모델 성능 개선과 위험도 낮추기에 한정돼 활용된다고 강조한다.

 

에이닷이 활용하는 마이크로소프트 클라우드 환경에 대해서도 데이터 접근 통제, 저장소 암호화, 운영자 권한 분리를 적용해 보호 수준을 높였다고 SK텔레콤은 밝히고 있다. 원본 음성과 텍스트는 삭제되고 요약본만 제한적으로 남는 구조라는 점을 거듭 부각하는 동시에, 이번 LG유플러스 사고와 같은 캐시 서버 오동작 가능성은 구조적으로 크지 않다고 주장한다.

 

카카오 역시 보이스톡을 통해 통화 요약 서비스를 제공하면서, 서버 처리 구조와 보관 정책을 상대적으로 엄격하게 가져가고 있다는 설명을 내놨다. 카카오에 따르면 보이스톡은 음성의 텍스트 변환과 요약 생성 작업을 서버에서 수행하지만, 처리가 끝나면 해당 데이터는 서버에서 즉시 파기된다. 완성된 요약본과 녹음 내용은 서버가 아닌 이용자 단말에 저장되며, 전화번호 등 상대방 정보는 통화 요약에 필수적이지 않다는 이유로 별도 수집·보관하지 않는다는 입장이다.

 

이번 LG유플러스 사고가 온디바이스와 서버 처리 방식 중 어느 쪽이 더 안전한지에 대한 단순 비교로 이어지는 것은 무리라는 분석도 나온다. 온디바이스 구조는 네트워크 전송 과정의 노출을 줄일 수 있지만, 편의 기능을 위한 서버 저장을 병행할 경우 관리 실패가 치명적인 유출로 이어질 수 있다. 반대로 서버·클라우드 중심 구조는 암호화와 접근 통제, 로그 감사 등 체계적인 보안 통제가 가능하지만, 한 번 침해가 발생하면 대규모 정보 노출로 이어질 위험도 있다.

 

전문가들은 통화 요약 같은 고감도 음성 데이터 서비스에서 가장 중요한 기준으로 데이터 최소 수집과 짧은 보관 기간, 명확한 삭제 정책을 꼽는다. 이용자가 삭제를 요청하거나 앱을 탈퇴한 뒤에도 요약본이 어디에 얼마나 남는지, 원본과 파생 데이터가 어떤 경로로 파기되는지 투명하게 공개해야 한다는 지적도 제기된다. 통신 3사와 플랫폼사가 경쟁적으로 AI 통화 비서를 앞세우는 만큼, 개인정보보호위원회와 과학기술정보통신부 등 규제 당국의 점검 강도도 높아질 수 있다.

 

업계 일각에서는 AI 통화 비서 서비스가 본격 확산되기 전에, 온디바이스와 서버 모두를 포괄하는 최소 수집·암호화·파기 기준을 제도화해야 한다는 주장도 나온다. 기술 경쟁이 데이터 수집 경쟁으로 변질될 경우, AI 신뢰도와 서비스 수용성이 동시에 떨어질 수 있다는 우려에서다. 산업계는 이번 LG유플러스 사고를 계기로 AI 통화 비서가 실제 시장에 안착할 수 있을지, 기술 구조뿐 아니라 데이터 거버넌스 수준까지 주시하고 있다.

최동현 기자
share-band
밴드
URL복사
#lg유플러스#sk텔레콤에이닷#카카오보이스톡