메뉴 건너뛰기

'非추론' 마지막 모델…"감성지능 등 향상으로 한층 더 사람처럼 대화"
리서치 프리뷰 방식으로 출시…월200달러 챗GPT 프로에 우선 제공


챗GPT 로고
[로이터 연합뉴스 자료사진. 재판매 및 DB 금지]


(샌프란시스코=연합뉴스) 김태종 특파원 = 생성형 인공지능(AI) 챗GPT 개발사 오픈AI는 최신 AI 모델 GPT-4.5를 리서치 프리뷰(research preview) 방식으로 출시한다고 27일(현지시간) 밝혔다.

리서치 프리뷰는 특정 사용자 그룹에 제한적으로 공개해 테스트하고 피드백을 수집하는 단계다.

GPT-4.5는 지난해 5월 처음 선보인 GPT-4o의 후속 모델로, 오픈AI의 마지막 비(非)추론 모델이다.

추론 모델인 'o 시리즈'와는 다른 일반 모델로, GPT-5부터는 추론 모델과 일반 모델이 통합된다.

샘 올트먼 최고경영자(CEO)는 지난 12일 소셜미디어(SNS)에서 GPT-4.5를 "수주 내 출시할 예정"이라며 "우리가 개발하는, 사고의 사슬(chain-of-thought)이 아닌 마지막 모델이 될 것"이라고 밝힌 바 있다.

'사고의 사슬'은 AI가 답을 도출하는 과정에서 중간 사고 과정을 거치는 추론을 의미하는 것으로, GPT-4.5는 추론하지 않는 마지막 모델이 될 것이라는 의미다.

오픈AI는 GPT-4.5가 "지금까지 대화형 모델 중 가장 크고 강력"하다며 패턴을 인식하고 연관성을 찾으며 논리적 추론 없이도 창의적인 통찰을 생성하는 능력이 향상됐다"고 강조했다.

새 모델은 더욱 광범위한 지식과 사용자 의도를 이해하는 능력, 특히 감성지능(EQ) 향상으로 한층 더 사람처럼 자연스러운 대화가 가능하다고 오픈AI측은 밝혔다.

오픈AI는 이를 통해 글쓰기를 개선하고 프로그래밍과 실용적인 문제 해결과 같은 작업에서 새 모델이 매우 유용하게 활용되고, 환각(hallucination·할루시네이션)은 감소할 것으로 예상된다고 설명했다.

'환각'이란 생성형 AI가 사실과 다른 정보를 내놓거나, 맥락과 관련없는 부정확한 정보를 내놓는 오류현상을 말한다.

GPT-4.5는 또 검색을 통해 최신 정보를 이용하고, 파일 및 이미지 업로드를 지원하며, 캔버스를 사용해 글쓰기 및 코딩 작업을 수행한다.

Q&A 정확도
[오픈AI 제공]


오픈AI는 GPT-4.5를 직전 모델인 'GPT-4o'와 최근 출시한 추론 모델인 'o3-미니'를 비교했다.

간단한 질문에 대한 답의 정확도는 GPT-4.5(62.5%)가 GPT-4o(38.6%), o3-미니(15.0%)보다 높았고 환각율(37.1%)도 GPT-4o(59.8%), o3-미니(80.3%)보다 낮았다.

AI 모델 벤치마크 테스트에서는 수학과 과학 등 4개 전 부문에서 GPT-4o를 능가했다. o3-미니보다는 언어와 멀티모달은 앞섰고 과학과 수학은 떨어졌다.

"시험에 떨어져 힘든 시간을 보내고 있다"고 하면 GPT-4o는 "정말 안타까워. 혹시 도움이 될 만한 몇 가지를 생각해볼 수 있을 것 같아"라며 몇 가지를 제시한다.

o3-미니는 "많이 지치고 답답한 기분일 것 같은데, 그건 너무나도 당연한 감정"이라면서 '시험 결과에 영향을 준 요인이 무엇이었는지' 등의 질문을 스스로 던져볼 수 있다고 답한다.

GPT-4.5는 "아이고(aw), 정말 안타까워. 시험에 실패하면 많이 속상하고 낙담할 수 있지만, 그것이 당신의 능력이나 가치를 결정하는 것은 아니야. 혹시 무슨 일이 있었는지 이야기하고 싶은지 아니면 그냥 기분 전환이 필요한지, 어떤 것이든 내가 여기 있을게"라며 이용자의 마음을 더 헤아리는 답변을 내놓는다.

GPT-4.5는 월 200달러 요금제의 챗GPT 프로에 우선 제공된다.

오픈AI는 "현재로서는 상당한 컴퓨팅이 필요하다"며 "우리는 더 넓은 지식, 더 강력한 직관, 더 큰 EQ 등 고유한 강점을 미래 모델의 모든 사용자에게 제공하기 위해 적극적으로 노력하고 있다"고 밝혔다.

AI 모델 벤치마크 평가
[오픈AI 제공]


[email protected]

연합뉴스

번호 제목 글쓴이 날짜
48581 트럼프 "푸틴, 평화협정 맺으면 지킬것"…영국 총리 "안전장치 필요" 랭크뉴스 2025.02.28
48580 길원옥 할머니 추모제서도 막말…“역사 부정 극우세력 공격 거세져” 랭크뉴스 2025.02.28
48579 [강주안의 시시각각] 극한 직업 헌법재판관 랭크뉴스 2025.02.28
48578 트럼프 “펜타닐 유입 못 막으면 3월4일 중국에 10% 추가 관세” 랭크뉴스 2025.02.28
48577 '집회 참석' 비판에 "수준이 이 정도밖에" 막말 랭크뉴스 2025.02.28
48576 4월 16일, 삼성의 '엣지' 공개된다…애플과 진검승부 [biz-플러스] 랭크뉴스 2025.02.28
48575 “중복상장 추진하는 대표이사 연임 막자”.... 소액주주 승전고, 오스코텍서도 울릴까? 랭크뉴스 2025.02.28
48574 기술주 투매 엔비디아 8% 하락… 나스닥 2.78% 급락 랭크뉴스 2025.02.28
48573 "지금 증시 내가 본 것 중 가장 위험"…美 헤지펀드 거물의 경고 [마켓시그널] 랭크뉴스 2025.02.28
48572 계엄 여파… 한국, 글로벌 민주주의 평가 '역대 최저점' 랭크뉴스 2025.02.28
48571 [단독] 마이바흐 끌며 "투자해" 유혹…90억 사기범 징역 9년 랭크뉴스 2025.02.28
48570 "교체하는 척 슬쩍?" 수상한 차량 정비소 랭크뉴스 2025.02.28
48569 [샷!] 나는 화초인가 잡초인가…심화하는 양극화 랭크뉴스 2025.02.28
48568 일단 잘 피했네… 서학개미, 엔비디아 급락 전 일주일 새 2100억원 순매도 랭크뉴스 2025.02.28
48567 추워도 옷 껴입고 잤는데 난방비 30만원?…'폭탄 고지서' 날아든 사람들 랭크뉴스 2025.02.28
48566 [팩트체크] 경기도 살면 인생의 20%를 지하철서 보낸다? 랭크뉴스 2025.02.28
48565 북, 서해에서 전략순항미사일 발사훈련…김정은 "핵무력 임전태세 준비" 랭크뉴스 2025.02.28
48564 오픈AI 추론·증류 없는 '최후의 일반 모델' GPT-4.5 내놨다 랭크뉴스 2025.02.28
48563 "왜 농사 안 도와줘"…매형 흉기로 위협한 60대 실형 랭크뉴스 2025.02.28
48562 뉴욕증시, 트럼프發 관세·엔비디아 실적에 일제히 하락…나스닥 2.78%↓ 랭크뉴스 2025.02.28