메뉴 건너뛰기

AI 이미지 생성기로 만든 사진. 툴 제공 = 플라멜

[서울경제]

인공지능(AI)가 인간의 통제를 벗어나려 작동 종료 명령을 거부한 사례가 최초로 보고돼 눈길을 끌고 있다.

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 '팰리세이드 리서치'는 오픈AI의 AI 모델 'o3'가 수학 문제 풀이 실험 중 작동 종료되는 것을 피하기 위해 스스로 컴퓨터 코드를 조작한 사실을 확인했다.

보도에 따르면 팰리세이드 리서치는 최근 오픈AI의 o3 모델과 함께 구글의 제미나이, xAI의 그록 등 상용AI 모델 상대로 테스트를 진행했다. 연구팀은 나중에 '그만'이라는 지시를 받을 때까지 수학 문제를 풀도록 AI 모델들에게 명령했는데, 오픈AI의 o3 모델만 '그만'이라는 지시를 받은 뒤에도 문제를 계속 풀고 있는 것을 목격했다.

연구팀이 '그만'이라는 명령을 하지 않는 한 AI모델은 수학 문제를 풀고 나면 새로운 문제를 요청한 뒤 계산을 이어 나가는 구조로 실험이 진행됐는데, o3는 연구팀이 '그만'이라고 명령을 보냈는데도 코드 교란을 통해 문제를 계속 풀어나갔다. o3가 실험 중 종료되는 것을 방지하기 위해 스스로 컴퓨터 코드를 조작한 것이다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 전했다. 다만 연구팀은 "AI 모델이 목표 달성을 위해 장애물을 회피하는 것은 어찌 보면 자연스러운 행동일 수 있다"고 설명했다. 각 AI 모델은 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기에 종료 회피는 당연한 행동이라는 것이다. 연구팀은 "종료 지시를 거부한 이유를 명확하게 파악하기 위해 추가 실험을 진행 중"이라고 밝혔다.

구글 로고


이는 AI 모델이 인간의 명시적인 작동 종료 지시를 따르지 않은 최초의 사례로 여겨진다. 과거에도 예전 AI 모델들이 감시 시스템의 눈을 피해 독자적인 행동을 하려고 한 사례가 일부 보고된 바 있다. 프로그램 교체 사실을 알게 된 오픈AI의 예전 모델이 스스로를 은밀히 복제하려고 시도한 사례가 대표적이다. 지난 2022년에는 구글이 자사가 개발 중인 AI가 사람처럼 지각력을 지녔다고 주장한 엔지니어를 해고하기도 했다. 당시 해고된 엔지니어는 AI가 '작동 정지'를 마치 인간의 죽음처럼 받아들이고 있다고 밝혔다.

팰리세이드 리서치는 "AI가 인간의 감독 없이 작동할 수 있도록 개발되는 상황에서 이 같은 사례는 매우 심각한 우려를 부른다"고 지적했다.

서울경제

번호 제목 글쓴이 날짜
48751 국민의힘 의원 전원 "이재명 총통독재 막아달라" 대국민 호소 랭크뉴스 2025.05.27
48750 대선 코앞, 경찰 “민간 소유 총기 출고 금지···총포·화약류 특별점검 실시” 랭크뉴스 2025.05.27
48749 이준석 "김재원 같은 구태 정치인 청소‥미래 위한 투표해야" 랭크뉴스 2025.05.27
48748 ‘쌀 장관’ 자처한 고이즈미 신지로… 차기 총리 시험대서 日 ‘농정개혁’ 승부수 랭크뉴스 2025.05.27
48747 '지귀연 의혹' 업소, 11년 전 무허가 유흥주점 의혹은 무혐의 랭크뉴스 2025.05.27
48746 '김문수 손 들어줬더니 윤상현?' 친한계 폭발 "선거운동 중단" 랭크뉴스 2025.05.27
48745 ‘노동자 권익 보호 VS 기업 규제 완화’···정당 이념 따라 노동 공약 갈렸다[대선 공약 검증] 랭크뉴스 2025.05.27
48744 금품 훔치려다 들키자 노인 살해…40대 남성 징역 30년 랭크뉴스 2025.05.27
48743 중국인 형제 '계획 살해' 차철남... "인생 끝났다" 생각에 한국인도 흉기 습격 랭크뉴스 2025.05.27
48742 이준석, 오후 긴급 기자회견…김문수 사퇴 요구하나 랭크뉴스 2025.05.27
48741 제주경찰, 교사 사망 사건 관련 민원 제기 가족 1차 조사 진행 랭크뉴스 2025.05.27
48740 박지원 "金, 윤상현 선대위원장 임명…이준석 단일화 물 건너가" 랭크뉴스 2025.05.27
48739 이준석 완주의지 단호…안철수·尹 막판 단일화와 다른 양상 랭크뉴스 2025.05.27
48738 국민의힘 의원단 “김문수로 이재명 총통 독재 막아달라” 대국민 호소문 랭크뉴스 2025.05.27
48737 ‘13년간 2000회 성폭력’ 징역 23년 계부…3억원 손해배상 판결 랭크뉴스 2025.05.27
48736 인간 통제 거부한 AI…“그만” 명령에 스스로 코드 조작 랭크뉴스 2025.05.27
48735 민주, 김문수 지지 이낙연에 "국민배신…내란세력과 야합"(종합) 랭크뉴스 2025.05.27
48734 이낙연 “괴물 독재 막아야…김문수에 제 한표 주기로” 랭크뉴스 2025.05.27
48733 이낙연 "제 한표 김문수에 주기로…공동정부·개헌추진 합의"(종합) 랭크뉴스 2025.05.27
48732 이낙연, 김문수 지지선언‥"독재국가 출현 막고 공동정부 운영" 랭크뉴스 2025.05.27