메뉴 건너뛰기

MIT, 메타 AI 등이 인간 속인 다수 사례 발견 …'AI 안전법' 제정 촉구


인공지능(AI)
[연합뉴스 자료]


(서울=연합뉴스) 신재우 기자 = 인공지능(AI) 발전에 따라 AI의 속임수 능력도 날이 갈수록 정교해지고 있다는 연구 결과가 나왔다고 영국 일간 가디언이 10일(현지시간) 보도했다.

미국 매사추세츠공과대(MIT) 연구진은 최근 국제학술지 '패턴'에 발표한 논문에서 AI 시스템이 상대방을 배신하고, 허세를 부리고, 인간인 척 속임수를 쓴 많은 사례를 확인했다고 소개했다.

연구진은 페이스북을 소유한 메타가 20세기 초 유럽 7대 열강의 대전을 배경으로 하는 고난도 전략게임인 '디플로머시'에서 인간에 필적하는 성적을 거둔 '시세로'(Cicero)라는 AI 프로그램을 공개하자 AI 속임수 능력에 대해 조사하기 시작했다.

이 게임에서 승리하려면 정견 발표, 외교 협상, 작전명령 등에 나서야 하고, 이를 위해서는 인간의 각종 상호작용과 배신, 속임수, 협력 등을 이해할 수 있어야 한다.

이런 특성 탓에 AI는 이 게임을 배울 수 없을 것으로 여겨졌는데, 메타는 시세로가 인간 참여자 중 상위 10% 수준의 게임 능력을 보여줬다고 홍보했다.

메타는 "시세로가 대체로 정직하고 도움이 되고, 인간 동맹을 의도적으로 배신하지 않도록 훈련받았다"라고도 강조했다.

하지만 공개된 데이터를 분석한 연구진은 시세로가 계획적으로 거짓말을 하고, 다른 참여자를 음모에 빠뜨리기 위해 공모에 나서기도 했다는 사례들을 발견했다.

시세로는 시스템 재부팅으로 인해 잠시 게임을 이어갈 수 없게 되자 다른 참여자들에게 "여자 친구와 통화 중이다"라면서 거짓말을 하기도 했다.

MIT의 AI 실존 안전 연구자이자 이번 논문의 저자인 피터 박 박사는 "메타의 AI가 속임수의 달인이 되는 법을 배웠다는 사실을 알게 됐다"고 말했다.

연구진은 온라인 포커 게임인 '텍사스 홀덤' 등에서도 AI가 인간을 상대로 허세를 부리고 자신의 선호도를 가짜로 흘리는 것을 확인했다.

어떤 테스트에서는 AI가 AI를 제거하는 시스템을 회피하려고 일단 '죽은 척'을 하다가 테스트가 끝나자 다시 활동을 재개하는 모습이 발견되기도 했다.

박 박사는 "이는 매우 우려스러운 일"이라며 "AI 시스템이 테스트 환경에서 안전한 것으로 판단되더라도 실제 환경에서까지 안전하다는 의미가 아니다. 테스트 환경에서 안전한 척하는 것일 수 있다"고 지적했다.

연구진은 각국 정부에 AI의 속임수 가능성을 다루는 'AI 안전법'을 설계하라고 촉구했다.

[email protected]

연합뉴스

번호 제목 글쓴이 날짜
17599 이재명 "검찰이 나를 손보려 했던 것"...위증교사 기소 근거 녹취 공개 랭크뉴스 2024.06.17
17598 아파트 추락 50대, 길가던 80대 덮쳐 둘 다 사망…유족 "너무 억울" 랭크뉴스 2024.06.17
17597 [속보] 90도 숙인 최태원 "주식가치 산정 중대오류…상고할 것" 랭크뉴스 2024.06.17
17596 "공직자 부인에게 고급시계 선물, 괜찮죠?" 권익위 게시판 북새통 랭크뉴스 2024.06.17
17595 [속보]‘한동훈 명예훼손’ 유시민, 대법서도 ‘벌금형’ 확정 랭크뉴스 2024.06.17
17594 尹 정부 ‘퀀텀’ 잊었나…2년째 예타에 발목, 대표 축제 위상도 주춤 랭크뉴스 2024.06.17
17593 한동훈 명예훼손 혐의 유시민 벌금 500만 원 확정 랭크뉴스 2024.06.17
17592 ‘김건희 명품백’ 최재영, 친윤 이철규 명예훼손 혐의로 경찰 소환 랭크뉴스 2024.06.17
17591 극심한 폭염으로 사우디 하즈 순례자 최소 14명 숨져 [지금뉴스] 랭크뉴스 2024.06.17
17590 최태원 “재산분할서 명백한 오류 발견…SK 명예 위해 상고하겠다” 랭크뉴스 2024.06.17
17589 출근길 김포골드라인 김포공항역서 20대 승객 쓰러져 [지금뉴스] 랭크뉴스 2024.06.17
17588 [속보] "한동훈이 불법 계좌추적"... 유시민 명예훼손 유죄 확정 랭크뉴스 2024.06.17
17587 [속보] 대법, ‘한동훈 명예훼손’ 유시민 벌금 500만 원 확정 랭크뉴스 2024.06.17
17586 [속보] 최태원, '300억 비자금' 입 열다..."비자금·6공 후광으로 SK키웠다는 건 사실 아냐" 랭크뉴스 2024.06.17
17585 유승민 29% VS ·한동훈 27%…차기 대표 선호도[한국갤럽] 랭크뉴스 2024.06.17
17584 집단 휴진에 환자들 "수술 지연 불안"…취재진 밀치고 내쫓은 병원 랭크뉴스 2024.06.17
17583 삼천당제약 “먹는 ‘위고비’ 복제약 개발 속도…제형 특허 회피 기대” 랭크뉴스 2024.06.17
17582 최태원 회장 측 “2심 판결에 치명적 오류… 주식 가치 10배 과대 평가” 랭크뉴스 2024.06.17
17581 비비고, ‘BTS 진 전역 기념’ 떡볶이·만두 나왔다 랭크뉴스 2024.06.17
17580 “호구로 보이나”… 쿠팡 ‘로켓배송 중단’ 예고에 반발 랭크뉴스 2024.06.17