메뉴 건너뛰기

인공지능 이미지/사진=Blutgruppe Corbis


인공지능(AI) 모니터링 해외 웹사이트 ‘트래킹 AI’(Tracking AI)가 매주 업데이트하는 AI 모델 대상 IQ 테스트가 화제다.

트래킹 AI는 17개의 텍스트 기반 AI 모델과 6개의 비전 기반 AI 모델을 대상으로 멘사 노르웨이 테스트와 오프라인 테스트를 진행하여 IQ를 측정했다. 멘사 노르웨이 테스트는 멘사에서 제작한 온라인 IQ 테스트이고 오프라인 테스트는 트래킹 AI가 직접 제작해 AI가 학습한 경험이 없는 문제로 구성되어 있다.

두 가지 테스트 종합 1등을 차지한 AI 모델은 구글의 제미나이 2.5 프로였다. 멘사 노르웨이 테스트에서 인간의 ‘매우 우수한’ 지능 수준으로 평가되는 IQ 128점을, 오프라인 테스트에선 115를 기록했다.

오프라인 테스트에서 특히 강세를 보인 모델은 앤트로픽의 클로드 3.7 소넷 익스텐디드로 107점을 기록했다.

전체 순위를 놓고 봤을 때 상위 10개 모델 중 6개는 오픈 AI의 모델이었다. o1 프로, o3 미니, o1, o3 미니하이, o1 프로(비전), GPT 4.5 프리뷰 모델이 모두 상위권을 차지했다. 앤트로픽은 클로드 3.7 소넷 익스텐디드와 클로드 3.7(비전) 모델이 각각 3위와 10위에 오르며 선방했다.

전세계 파장을 일으킨 딥시크의 R1, V3 모델은 각각 15위와 17위에 머물렀고 xAI의 그록3 씽크와 그록-3는 각각 12위, 18위에 올랐다. 메타는 라마 4 메버릭이 9위, 라마 3-2는 하위권에 올랐다.

그러나 IQ가 AI의 성능을 평가하는 기준이라고 볼 수는 없다. 영국 옥스퍼드대학의 기술 및 규제 연구자 산드라 왁터는 ‘인간과 AI를 같은 척도로 비교해선 안된다’며 ‘자동차는 인간보다 빠르고 잠수함은 잠수능력이 더 뛰어나지만 이것이 인간 지능을 능가한다는 것을 의미하지는 않는다’고 비판했다.

IQ 테스트 방식 자체에 대한 비판도 있었다. 킹스 칼리지 AI 전문 연구원 마이크 쿡은 ‘IQ 테스트는 매우 유사한 패턴을 반복하는 경향이 있다’며 그 패턴만 학습하면 되는 AI가 인간과 같은 기준으로 평가될 수 없다고 비판했다.

AI를 평가하는 별도의 기준이 필요하다는 목소리가 나오고 있다. AI 연구소 ‘AI 나우 인스티튜트’의 수석 과학자 하이디 클라프는 “기계 학습 모델의 성능을 인간 지능과 직접 비교하는 것은 비논리적”이라며 “AI를 평가하기 위한 별도의 척도를 마련해야 한다”고 말했다.

한경비즈니스

번호 제목 글쓴이 날짜
44821 ‘초고속 산불’에도 인명 피해 ‘0’…무엇이 달랐나? 랭크뉴스 2025.04.16
44820 치료인 척 연쇄 살인…환자 15명 숨지게 한 의사, 독일 충격 랭크뉴스 2025.04.16
44819 20세 최연소 사시 합격자, 김앤장 퇴사 후 대학원 진학한 이유는? 랭크뉴스 2025.04.16
44818 백악관 “대중 관세 최대 245%” 과시형 공세…중 “웃기는 숫자놀음” 랭크뉴스 2025.04.16
44817 이재명, 타임지 '영향력 있는 100인'에 선정…블핑 로제도 포함(종합2보) 랭크뉴스 2025.04.16
44816 이재명, 타임지 '올해의 100인' 선정…"대선 승리 유력한 후보" 랭크뉴스 2025.04.16
44815 카이스트표 '마법샴푸' 불티나더니…이번엔 '칙칙' 뿌리면 단숨에 풍성해진다? 랭크뉴스 2025.04.16
44814 “빚 떠안을까봐” 일가족 5명 살해 50대 가장...경찰, 구속영장 신청 랭크뉴스 2025.04.16
44813 한 달 반 남은 권한대행이 '관세 협상' 주도‥트럼프 압박에 끌려가나? 랭크뉴스 2025.04.16
44812 관세 협상 트럼프 직접 등판 소식에, 일본 긴장 “전략 수정 불가피” 랭크뉴스 2025.04.16
44811 헌재 韓 지명 위헌가능성에 주목…민주 "당연한 판결" 국힘 "편향된 판결" 랭크뉴스 2025.04.16
44810 ‘대통령 고유 권한 자의적 행사’ 비판 불가피…한덕수, 조기대선 앞두고 국정 리더십 타격 랭크뉴스 2025.04.16
44809 이재명, 타임지 선정 올해 가장 영향력 있는 100인에 포함(종합) 랭크뉴스 2025.04.16
44808 "몸이 너무 간지럽다"…대학교 남자기숙사 발칵, 무슨 일 랭크뉴스 2025.04.16
44807 대선 전 헌소 본안 판단 가능성 희박···한덕수 ‘헌법재판관 2인 지명’ 사실상 무산 랭크뉴스 2025.04.16
44806 ‘1박 2일’ 베란다 갇힌 노인…순찰 경찰관이 구조 랭크뉴스 2025.04.16
44805 "편히 살다 가겠소, 징하게 감사허요"…1500명 움직이게 한 80대 할머니의 진심 랭크뉴스 2025.04.16
44804 "엄마라서 포기 못 해"‥세월호 '준영 엄마'의 약속 랭크뉴스 2025.04.16
44803 효력 정지된 한덕수의 도발, ‘대망론’도 함께 꺼지나 랭크뉴스 2025.04.16
44802 업무 혼란 속 PA 간호사…“리스크 큰데 보상 없어” 랭크뉴스 2025.04.16