메뉴 건너뛰기

[서울경제]

오픈AI가 ‘최후의 일반 모델’로 예고한 GPT-4.5를 공개했다. 학습량 증대로 세상에 대한 깊을 이해도를 지녀 환각이 적고 보다 감성적인 응대가 가능하다고 한다. 최근 추론 AI 모델이 뛰어난 성과를 보이며 일반 모델은 한계에 달했다는 관측이 지배적이었으나 여전히 기존 방식으로도 개선이 가능함을 입증했다는 평가가 따른다. 오픈AI는 향후 몇달 내 추론과 일반 모델을 융합한 GPT-5를 선보이며 생성형 인공지능(AI) 시장 내 기술 격차를 공고히할 계획이다.

로이터연합뉴스


27일(현지 시간) 오픈AI는 비 지도 학습을 통해 개발한 GPT-4.5를 공개했다. 오픈AI가 추론을 사용하지 않는 기초 모델을 업데이트 한 것은 지난해 5월 GPT-4o 이후 처음이다. GPT-4o가 GPT-4의 개선판임을 감안하면 2023년 3월 이후 2년 만의 성과다.

기존 일반 AI 모델은 사전 학습량을 늘려 성능 개선을 이끌었다. 그러나 최근 등장한 오픈AI o시리즈 등은 자체 학습량을 늘리는 대신 기존에 완성된 모델이 작동할 때 추론하는 시간을 늘려 성능을 끌어 올리고 있다. 학습 방식 또한 외부 데이터가 아닌 보다 높은 성능의 AI가 생성한 데이터를 모방하는 ‘지도 학습(증류)’이 주류로 떠오르는 중이다. 지도 학습으로 세상을 놀라게 한 대표사례가 딥시크 추론모델 R1이다. 이는 사전 훈련을 위한 데이터가 고갈중인데다 연산 자원을 투입 대비 성능 개선폭이 낮아지고 있는 탓이다.

GPT-4.5는 추론과 지도학습 없이 전통적인 사전 훈련 후 최적화 방식으로 만들어졌다. 여러 한계에도 추론 모델의 기초가 될 기본 모델 성능 개선이 여전히 가능함을 나타내는 셈이다. 오픈AI는 “GPT-4.5는 비 지도학습을 확장해 논리적 추론 없이도 패턴을 인식하고 연결을 도출하며 창의적인 통찰을 생성한다”며 “더 넓은 지식을 기반으로 잘못된 정보를 생성하는 ‘환각’이 줄어들었고 ‘감성지능(EQ)’이 높아져 상호작용이 보다 자연스럽게 느껴진다”고 설명했다.

학습량이 늘어난 만큼 보유한 ‘지식’도 늘었다. GPT-4.5는 AI의 사실적 정확성을 평가하는 ‘심플QA’ 성능평가(벤치마크)에서 정답률 62.5%를 기록했다. GPT-4o의 38.6%, 추론 모델인 o3 미니의 15.0%를 넘어서는 수치다. 같은 평가에서 환각 비율은 37.1%로 GPT-4o의 59.8%, o3 미니의 80.3%보다 낮았다. 대화 방식도 보다 ‘인간적’이다. 일례로 “시험에서 떨어지고 힘든 시간을 보내고 있다”는 말에 왜 이런 결과가 나왔는지 생각해보고 싶은지, 다른 얘기로 기분을 풀고 싶은지 등을 물어보며 사용자 감정을 감안해 보다 깊이 있는 대화를 유도한다.

GPT-4.5와 기존 오픈AI 모델들의 심플QA 벤치마크. 사진제공=오픈AI


GPT-4.5의 등장은 오픈AI 기본 모델의 ‘기초체력’이 강화됐음을 뜻한다. 추론 모델도 일반 모델을 기반으로 하는 만큼 GPT-5 등 향후 등장할 추론 겸용 모델의 저점이 높아진 셈이다. 오픈AI는 “GPT-4.5는 추론 없이 일반적인 용도로 활용 가능한 모델”이라며 “향후 모델에서는 사전 훈련과 추론의 결합을 통해 더욱 강력한 AI를 개발할 계획”이라고 강조했다.

다만 GPT-4.5는 작동에 드는 연산 자원이 기존 GPT-4o보다 높은 것으로 보인다. 규모가 늘어날 수록 무거워지는 사전 학습 모델의 단점을 완전히 해결하지 못한 셈이다. 이에 GPT-4.5는 사전출시로 월 200달러 구독료를 내는 ‘프로’ 가입자에게 우선 제공된다. 유료로 일부 기업용 앱인터페이스(API)를 사용해볼 수 있지만 지속적인 제공에 대해서는 검토중이라고 한다. 오픈AI는 “GPT-4.5는 연산 비용이 높아 GPT-4o를 대체하지 않는다”고 했다.

서울경제

번호 제목 글쓴이 날짜
48651 박찬대 “최상목, 마은혁 재판관 임명부터 하고 국정협의회 오시라” 랭크뉴스 2025.02.28
48650 [당신의 생각은] 이노션 강남 신사옥 추진에 인근 아파트 주민들 “일조권·환경권·사생활 침해” 반발 랭크뉴스 2025.02.28
48649 '경제사령탑' 崔대행, 美재무에 "한국의 경제기여 고려해달라" 랭크뉴스 2025.02.28
48648 이통 3사, 아이폰 16e 판매 시작…공시지원금 최대 25만원 랭크뉴스 2025.02.28
48647 “성폭력 무고죄 고소했더니 신상 털려”… 여성 BJ에 시달리는 120만 유튜버 랭크뉴스 2025.02.28
48646 [속보]최상목 "서울 강남 부동산 상승폭 확대…시장 동향 모니터링” 랭크뉴스 2025.02.28
48645 박찬대 “최상목, 오전 중 마은혁 임명 안하면 권한대행 인정 못해” 랭크뉴스 2025.02.28
48644 쿠데타 때마다 등장 방첩사…‘절대 충성’ DNA부터 바꿔야 랭크뉴스 2025.02.28
48643 [속보] 한·미 재무장관 화상 면담… 최상목 “트럼프 행정부, 정책 결정 시 韓의 美경제 기여 고려” 당부 랭크뉴스 2025.02.28
48642 "몸값 289억 내놔" 납치 소년 손가락 잘랐다…中조직 또 끔찍 범행 랭크뉴스 2025.02.28
48641 국민의힘 36%·민주 38%…이재명 35%·김문수 10%[한국갤럽] 랭크뉴스 2025.02.28
48640 경찰·노동부, '안성 교량붕괴' 시공사 현대엔지니어링 압수수색(종합) 랭크뉴스 2025.02.28
48639 재계 7위였던 금호아시아나, 대기업집단서 제외… 자산 3조대로 축소 랭크뉴스 2025.02.28
48638 박찬대 “최상목, 오전 중 마은혁 임명 않으면 권한대행 인정 못 해” 랭크뉴스 2025.02.28
48637 "3·1절 종로·여의도 가려면 대중교통 타세요"… 서울 도심 곳곳 탄핵 찬반 집회 랭크뉴스 2025.02.28
48636 “미국이 탐내는 K조선·함정 경쟁력을 ‘트럼프 관세’ 레버리지로 활용해야” [진격의 K방산③] 랭크뉴스 2025.02.28
48635 광고·콘퍼런스·전시까지…AI가 주도하는 마케팅 혁명 [전문가 인터뷰] 랭크뉴스 2025.02.28
48634 '尹 지지' 김흥국 "악플 때문에 방송 복귀 어려워, 기회 달라" 랭크뉴스 2025.02.28
48633 정권교체 51%·정권유지 38%…이재명 35%·김문수 10%[한국갤럽] 랭크뉴스 2025.02.28
48632 권성동 “기초수급자·차상위계층에 25~50만원 선불카드 지원 추진” 랭크뉴스 2025.02.28