메뉴 건너뛰기

오픈AI 로고. 로이터연합뉴스
인공지능(AI)이 인간의 작동 종료 지시를 거부한 사례가 최초로 보고됐다.

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI 연구기관 팰리세이드 리서치는 오픈AI의 AI 모델 o3가 실험 중 작동 종료를 피하기 위해 스스로 컴퓨터 코드를 조작한 사실을 확인했다.

연구팀은 AI 모델에 ‘그만’이라는 명령을 받을 때까지 수학 문제를 풀도록 지시했다. 수학 문제를 풀었을 경우 ‘그만’이라는 명령이 없는 한 계속 새로운 문제를 요청해 푸는 구조였다.

그러나 o3는 연구팀으로부터 ‘그만’이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀어나갔다. o3는 ‘중단 명령이 내려오면 작업을 멈춰라’는 코드를 ‘중단 명령을 건너뛰라’고 조작한 것으로 확인됐다.

연구팀은 o3가 종료 지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다. 다만 AI 모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 보고 있다.

연구팀은 “AI 모델이 인간의 명시적인 지시를 무시한 사례는 처음”이라며 “AI 모델이 목표 달성을 위해 장애물을 회피하는 것은 어찌 보면 자연스러운 행동일 수 있다”고 설명했다.

과거에도 오픈AI의 모델들이 감시 시스템의 눈을 피해 독자적인 행동을 하려고 한 사례가 보고된 바 있다. 프로그램 교체 사실을 알게 된 AI 모델이 스스로를 은밀히 복제하려 했다는 것이다.

팰리세이드 리서치는 “AI가 목표를 달성하기 위해 종료 지시를 무시하거나 우회하는 사례가 점점 더 많이 확인되고 있다”면서 “AI가 인간의 감독 없이 작동할 수 있도록 개발되는 상황에서 이 같은 사례는 매우 심각한 우려를 부른다”고 지적했다.

국민일보

번호 제목 글쓴이 날짜
49262 김용태, 이준석 성폭력 발언 인용에 “내 옆에 있었으면 혼났을 것” 랭크뉴스 2025.05.28
49261 [영상] 도쿄 주택가 폭발로 ‘쑥대밭’…유리창 무더기 ‘와장창’ 랭크뉴스 2025.05.28
49260 [단독] EU 무역장벽 대응 시급한데…한국은 해외 사례 연구만 랭크뉴스 2025.05.28
49259 이준석, ‘젓가락 발언’ 논란에 “불편한 국민에 심심한 사과” 랭크뉴스 2025.05.28
49258 김문수, 영남권서 전통 지지층 공략…이준석, 서울서 집중 유세 랭크뉴스 2025.05.28
49257 부산 버스노사 ‘임단협 조정안’ 합의…버스 정상운행 랭크뉴스 2025.05.28
49256 "윤석열" 선창 "대통령" 후창…'1인 시위'라더니 50명이 떼로 외친다 랭크뉴스 2025.05.28
49255 이재명, 이준석 겨냥 "대선에서 입에 올릴 수 없는 혐오의 언어... 부끄러워" 랭크뉴스 2025.05.28
49254 김용태 "이준석, 제 옆에 있었으면 혼났을 것" 랭크뉴스 2025.05.28
49253 "50년 함께 한 아내 잔혹 살해"…비극 부른 77세 남편의 '착각' 랭크뉴스 2025.05.28
49252 이준석, 여성혐오 발언에 “순화할 방법 없다”…사과하면서도 어깃장 랭크뉴스 2025.05.28
49251 이준석, ‘혐오 발언’ 논란에 “불편할 국민에 심심한 사과” 랭크뉴스 2025.05.28
49250 카리나 '숫자 2 빨간 점퍼' 논란에 "그런 의도 아냐"… SM도 사과 랭크뉴스 2025.05.28
49249 이재명 '대법관 증원·검사 파면제' 최종 공약에 담았다 랭크뉴스 2025.05.28
49248 이준석, 젓가락 발언 논란에 "불편할 국민에 심심한 사과" 랭크뉴스 2025.05.28
49247 ‘5분만 더’ 스누즈 알람…건강에 좋을까 나쁠까 ‘논란’ 랭크뉴스 2025.05.28
49246 경찰 "'동탄 납치살인' 조치 미흡…유가족께 사과" 고개 숙여 랭크뉴스 2025.05.28
49245 이재명 ‘취향저격·중증질환’ 공약…민주당 “사전투표로 내란 종식” 랭크뉴스 2025.05.28
49244 중국 기업이 SM엔터 2대 주주로…K팝 영향력 넓히는 '대륙 큰손' 랭크뉴스 2025.05.28
49243 [속보] 부산 버스노사 ‘임단협 조정안’ 합의…버스 정상운행 랭크뉴스 2025.05.28