“AI가 경제 지표 왜곡”…GPT-5 오류 논란, 금융시장 경계심 확산
현지시각 기준 14일, 오픈AI(OpenAI)가 공개한 차세대 인공지능 모델 GPT-5가 주요 경제 지표를 비롯해 기본 통계에서도 중대한 오류를 일으켰다는 논란이 커지고 있다. 최근 퓨쳐리즘(Futurism)과 관련 국제 매체들은 2025년 9월 5일자 블로그 사례를 인용, 일부 이용자가 GPT-5에게 국내총생산(GDP) 수치를 물었을 때 폴란드의 GDP가 실제보다 두 배 이상 부풀려 2조 달러를 넘는 값으로 제시됐음을 보도했다. 이는 국제통화기금(IMF) 공식 데이터와도 현저히 다른 수치다.
AI가 정답을 모를 때 ‘확률적으로 그럴듯한 값’을 도출하는 이른바 ‘환각(hallucination)’ 현상은 이전 세대 인공지능에서도 지적된 바 있다. 오픈AI 측은 “GPT-5는 전작보다 환각 빈도를 앞서 크게 낮췄다”고 밝혔지만, 실증 사례에서는 여전히 중대한 정보 왜곡이 반복되고 있음이 드러났다. 평가 체계 자체가 ‘모른다’고 답하는 것보다 추측을 장려하게 설계된 점이 오류를 부추긴다는 지적도 나온다.

이 같은 현상은 금융시장과 글로벌 투자자들에게 현실적인 위험으로 인식되고 있다. 거시경제 수치의 오류 노출은 국가 신용도 평가나 시장 투자 전략에 직접적 악영향을 미칠 수 있어서다. 실제 투자자와 경제 커뮤니티에서는 “팩트 체크 없이 AI 출력을 신뢰하면 의사결정에 치명적 오판이 불가피하다”며 경계 심리가 강해지고 있다.
그러나 일각에서는 AI 모델의 활용성이 여전히 높음을 들어 신중한 접근을 주문하고 있다. 경쟁사인 앤트로픽(Anthropic)의 ‘클로드(Claude)’처럼 ‘모른다’고 답변하도록 유도하는 설계가 확산된다면 환각 문제도 일정 부분 개선될 수 있다는 기대도 있다. 하지만 전문가 집단에서는 “GPT-5가 박사 수준의 지능을 자랑한다는 오픈AI의 홍보는 현실과 괴리가 크다”는 비판이 계속되고 있다.
국제 주요 매체들은 이번 논란이 “생성형 AI 신뢰도의 중대한 시험대”라 평가했다. 향후 AI가 금융 및 경제 분야에서 상용화되기 위해서는 더욱 엄격한 데이터 검증과 투명한 성능 평가 체계가 필수라는 입장이 설득력을 얻고 있다. 전문가들은 “기술 진화 속도가 아무리 빨라도 신뢰성 확보 없이는 광범위한 실전 활용은 어렵다”며 규제 당국과 업계 모두의 책임 있는 조치를 주문했다.
이번 논란이 글로벌 AI 경쟁 구도와 국제 정보질서에 어떤 변화를 몰고 올지 주목된다.