메뉴 건너뛰기

연합뉴스

[서울경제]

생성형 인공지능(AI) 챗GPT-4로 생성한 답안이 실제 대학교 시험에서 학생들이 직접 작성해 제출한 답안보다 더 높은 점수를 받았다는 연구결과가 나왔다. 답안의 94%는 채점자에게 적발되지 않았다. AI 도구 사용이 대중화되면서 교육과 평가 시스템에 대책 마련이 필요하다는 지적이 나온다.

27일(현지시간) 영국 레딩대 심리·임상언어과학대학 피터 스카프 교수팀은 과학 저널 플로스 ONE에서 이 대학 실제 학부 시험에 AI 작성 답안을 제출하는 엄격한 블라인드 방식 실험에서 이런 결과를 얻었다고 밝혔다.

연구팀은 “이 연구는 지금까지 인간 교육자가 AI 생성 콘텐츠를 구별할 수 있는지 알아보는 실험 중 가장 크고 강력한 블라인드 실험”이라며 “이 결과는 AI가 대학 시험에서도 컴퓨터(인공지능)와 인간을 구별해내는 튜링 테스트를 통과했음을 보여준다”고 했다.

연구팀은 이 연구에서 심리학 학사 학위 취득을 위한 5개 학부 시험(단답형 3개, 에세이 2개)에 100% 챗GPT-4가 작성한 답안을 가짜 학생 33명의 이름으로 제출했다. 채점자들은 이 연구에 대해 모르는 상태에서 실험이 진행됐다.

그 결과 AI가 작성한 답안의 94%가 채점자들에게 적발되지 않았고, 평균적으로 실제 학생의 답안보다 더 높은 점수를 받은 것으로 나타났다.

AI가 작성한 답안과 실제 학생 답안을 무작위로 선택해 비교할 경우 AI 답안이 점수가 높을 확률이 83.4%에 달했다.

또 실제 학생이 AI 점수 중간값보다 높은 점수를 받는 비율은 4개 시험에서 4.35~17.63%에 불과했고, 에세이 시험 중 1개에서만 실제 학생 57.14%의 점수가 AI 점수 중간값을 넘었다.

연구팀은 “이 결과는 학생들이 부정행위에 AI를 사용할 수 있고 이들이 다른 학생보다 더 좋은 성적을 받을 가능성을 시사한다”며 “연구 과정에서 실제 학생 중 상당수가 AI 생성 제출물을 통해 부정행위를 했을 가능성도 고려하고 있다”고 했다.

그러면서 “AI가 교육 평가에 어떤 영향을 미칠 수 있는지 보여주는 것으로 매우 우려스럽다”며 “전 세계 교육 부문이 AI 발달에 대응해 새로운 정책과 지침을 만들어 문제 해결을 위해 더 많은 노력을 기울여야 한다”고 강조했다.

서울경제

번호 제목 글쓴이 날짜
39002 경찰 “호텔 CCTV엔 역주행 부부 다투는 모습 없어” 랭크뉴스 2024.07.05
39001 김병환 금융위원장 후보자 “금투세 폐지 필요하다” 랭크뉴스 2024.07.05
39000 영국 총선 노동당 압승…14년 만에 정권 교체 랭크뉴스 2024.07.05
38999 도시가스 요금 8월부터 6.8% 인상…4인 가구 월 3,770원↑ 랭크뉴스 2024.07.05
38998 아파트 화단에 ‘5000만원 돈다발’ 발견…경찰 수사 랭크뉴스 2024.07.05
38997 4년 전 '332번 카톡' 한-김, 이번엔 전면전? '파문' 랭크뉴스 2024.07.05
38996 87층에도 구조대가… ‘깜짝 실적’ 삼성전자, 41개월 만에 최고가 랭크뉴스 2024.07.05
38995 '급가속' 직전 부부의 상황‥"다투는 모습은 없었다" 랭크뉴스 2024.07.05
38994 육사 선배 ‘원스타’가 ‘투스타’ 사령관에게 폭언···군, 정보사 하극상에 수사 랭크뉴스 2024.07.05
38993 허웅, 유튜브 방송 통해 해명…폭행·낙태 강요 등 부인 랭크뉴스 2024.07.05
38992 ‘명품백 사과’ 김건희 문자 ‘읽씹’ 논란…韓 “왜 이 시점에 그 얘기를” 랭크뉴스 2024.07.05
38991 ‘고령 논란’ 바이든 “일정 줄이고 잠 더 자겠다” 랭크뉴스 2024.07.05
38990 탄핵 피소추 검사, '울산지검 술판 의혹' 제기 이성윤 등 8명 고소(종합) 랭크뉴스 2024.07.05
38989 "朴 탄핵 전야제처럼 흘러가"‥'117만 청원'에 홍준표도.. 랭크뉴스 2024.07.05
38988 “드디어 탈출”…삼성전자, 52주 신고가에 개인 매도 행렬 랭크뉴스 2024.07.05
38987 한동훈 “영부인과 사적인 정무 논의 부적절”…나경원·원희룡·윤상현 비판 [지금뉴스] 랭크뉴스 2024.07.05
38986 '베테랑 운전자'? 시청역 사고 G80 보험이력 보니 '거의 매년 사고' 랭크뉴스 2024.07.05
38985 '영끌족' 부활하나…생애 첫 아파트 매입 증가에 노도강도 '신고가' 속출 랭크뉴스 2024.07.05
38984 동아제약·녹십자 이어 한미까지, 제약사 창업주 일가 경영권 분쟁사 랭크뉴스 2024.07.05
38983 급발진 주장 택시운전사, '블박' 봤더니… 가속페달 '꾹’ 랭크뉴스 2024.07.05