생성형 AI 부정행위에 뚫린 온라인 시험…고려대, 재시험 선택
생성형 인공지능 확산이 대학 평가 방식의 허점을 그대로 드러내고 있다. 온라인 시험 환경에서 답안 재제출과 AI 풀이 도움을 동시에 허용할 경우, 전통적 시험 규범이 의미를 잃는다는 지적이 나온다. 대학들은 비대면 수업과 학습관리시스템을 기반으로 한 평가를 확대해 왔지만, 최근 연쇄적인 집단 부정행위 사례가 터지면서 온라인 시험 체계 전반을 손봐야 한다는 압력이 커지고 있다. 업계에서는 이번 사태를 두고 교육 분야 디지털 전환의 시험대이자, 평가 기술과 규범 재정립 경쟁의 분기점으로 보고 있다.
20일 대학가에 따르면 이날 오전 고려대 공과대학 전공 과목인 공학수학 온라인 시험에서 집단 부정행위 의혹이 제기됐다. 수강생 80여 명을 대상으로 한 이번 평가는 강의실에서 고려대 학습관리시스템 KU LMS를 통해 진행됐으며, 시험 방식은 온라인 퀴즈 형식으로 설계됐다.

문제는 시스템 설계의 허점에서 시작됐다. 답안을 제출한 뒤 바로 채점 결과를 확인한 후, 다시 시험에 재응시할 수 있도록 설정돼 있었던 것이다. 상당수 수강생이 이 기능을 이용해 틀린 문제를 확인한 뒤 정답으로 고쳐 여러 차례 퀴즈를 반복 응시한 정황이 포착됐다. 사실상 사전 피드백을 바탕으로 무제한 재도전이 가능한 구조였던 셈이다.
문항 구성은 OX와 단답형 중심이었다. 비교적 짧은 형식의 답변이 요구되는 만큼, 생성형 인공지능 프로그램에 문제를 직접 입력해 풀이를 요청했을 가능성도 제기됐다. 실제로 일부 학생이 생성형 AI를 활용한 것으로 추정되는 기록이 확인된 것으로 알려졌다. 수식 풀이와 개념 확인까지 지원하는 최신 AI 툴 특성상, 공학수학과 같은 이공계 핵심 교과에서도 AI 의존도가 빠르게 높아지고 있다는 방증으로 해석된다.
담당 교수는 시험 종료 후 채점 과정에서 비정상적인 응시 패턴을 발견했다. 다수 학생이 짧은 시간 간격으로 퀴즈를 반복 응시한 기록이 집중되면서 부정행위 의심 사례가 드러났다는 설명이다. 교수는 수강생에게 공지문을 통해 집단 부정행위 의혹을 알리고, 지필평가 방식의 재시험을 실시하겠다고 통보했다.
학교 측도 입장을 정리했다. 한 고려대 관계자는 다음 시험을 종이 문제지를 활용한 오프라인 지필 방식으로 진행하겠다는 것이 담당 교수의 판단이라고 전했다. 학습관리시스템 기반 온라인 시험은 관리 효율성과 채점 속도 측면에서 장점이 있지만, 평가 공정성을 담보하는 장치가 미흡할 경우 동일한 논란이 반복될 수 있다는 점을 인정한 셈이다.
이번 사건은 고립된 사례가 아니다. 고려대는 이미 지난달 25일 교양과목 고령사회에 대한 다학제적 이해 중간고사에서 대규모 집단 부정행위가 확인돼 시험을 전면 무효 처리한 바 있다. 약 1400명이 수강하는 대형 온라인 강좌였고, 부정행위에 활용된 오픈채팅방에는 500명가량이 참여한 것으로 파악됐다. 이 채팅방에서는 정답 공유와 문제 풀이 협업이 실시간으로 이뤄졌고, 일부 참여자는 AI를 동원해 답을 도출한 뒤 결과를 공유했다는 증언도 나왔다.
국내 주요 대학에서 유사한 양상은 이미 반복되고 있다. 서울대, 연세대를 포함한 여러 대학에서 리포트, 퀴즈, 온라인 시험 등 다양한 형태의 평가에서 생성형 AI 활용 부정행위가 확인되거나 의심을 사고 있다. 질문을 그대로 복사해 AI에 입력한 뒤 조정 없이 제출하는 경우부터, 수학·공학·코딩 문제를 AI에게 풀게 하고 정답만 옮겨 적는 방식까지 유형도 다양하다.
평가 기술 측면에서는 온라인 시험 감독 솔루션, 원격 감 proctoring 시스템, 브라우저 잠금 프로그램 등 디지털 통제 장치 도입 논의가 다시 고개를 들고 있다. 시험 중 다른 웹사이트 접속을 막고, 화면 녹화와 카메라 모니터링을 결합해 부정행위를 탐지하는 기술이다. 다만 개인정보 수집과 감시에 대한 학생 반발, 비용 부담, 실제 탐지 정확도 문제 등이 얽혀 있어 도입이 쉽지 않은 상황이다.
특히 생성형 AI 도구는 일반 검색보다 훨씬 정교한 학습 지원을 제공한다는 점에서, 어디까지가 학습 보조이고 어디부터가 부정행위인지 경계가 모호해지고 있다. 단순 암기형 문제나 정답 일치형 평가에 의존하는 온라인 시험 구조는 사실상 AI에 답안을 아웃소싱하는 것을 막기 어렵다. 문제은행 랜덤 출제, 난이도 조정, 서술형·구술형·프로젝트형 평가 확대가 불가피해 보이는 이유다.
글로벌 대학들도 유사한 고민에 직면해 있다. 미국과 유럽 일부 대학은 AI 사용 자체를 전면 금지하기보다, 과제나 시험 지침에 허용 범위를 구체적으로 명시하는 방향으로 전환 중이다. 예를 들어 초안 작성까지는 허용하되, 코드 작성이나 정답 도출 자체를 맡기는 행위는 금지하고, 사용 시 반드시 명시하도록 요구하는 식이다. 평가 기술을 AI 시대에 맞게 재설계하되, 규범과 책임을 병행하는 접근이다.
전문가들은 국내 대학도 온라인 시험 시스템과 학사 규정을 동시에 손봐야 한다고 지적한다. 생성형 AI를 전제로 한 시험 설계를 도입하지 않는 한, 기술을 막는 방식의 통제는 실효성이 떨어질 수 있다는 것이다. 한 고등교육 연구자는 AI를 활용해도 학생이 개념을 스스로 설명하고 적용 능력을 보여야 통과할 수 있는 평가 방식이 필요하다며, 이번 사태를 교육 디지털 전환의 후행 과제인 평가 혁신 논의를 앞당기는 계기로 봐야 한다고 말했다.
대학가에서는 짧은 기간 안에 온라인 시험을 지필 중심으로 되돌리려는 움직임과, 중장기적으로 AI 친화적 평가체계로 전환하려는 논의가 교차하고 있다. 산업계와 교육계 모두에서 AI 활용 역량이 요구되는 만큼, 기술 활용과 학업 윤리, 평가 공정성 사이 균형점을 어떻게 설정할지가 향후 과제가 되고 있다. 산업계는 이번 사건을 계기로 대학이 어떤 평가 모델을 선택할지, 그리고 그 변화가 인재 양성 구조에 어떤 영향을 줄지 주시하고 있다.
