메뉴 건너뛰기

'非추론' 마지막 모델…"감성지능 등 향상으로 한층 더 사람처럼 대화"
리서치 프리뷰 방식으로 출시…월200달러 챗GPT 프로에 우선 제공


챗GPT 로고
[로이터 연합뉴스 자료사진. 재판매 및 DB 금지]


(샌프란시스코=연합뉴스) 김태종 특파원 = 생성형 인공지능(AI) 챗GPT 개발사 오픈AI는 최신 AI 모델 GPT-4.5를 리서치 프리뷰(research preview) 방식으로 출시한다고 27일(현지시간) 밝혔다.

리서치 프리뷰는 특정 사용자 그룹에 제한적으로 공개해 테스트하고 피드백을 수집하는 단계다.

GPT-4.5는 지난해 5월 처음 선보인 GPT-4o의 후속 모델로, 오픈AI의 마지막 비(非)추론 모델이다.

추론 모델인 'o 시리즈'와는 다른 일반 모델로, GPT-5부터는 추론 모델과 일반 모델이 통합된다.

샘 올트먼 최고경영자(CEO)는 지난 12일 소셜미디어(SNS)에서 GPT-4.5를 "수주 내 출시할 예정"이라며 "우리가 개발하는, 사고의 사슬(chain-of-thought)이 아닌 마지막 모델이 될 것"이라고 밝힌 바 있다.

'사고의 사슬'은 AI가 답을 도출하는 과정에서 중간 사고 과정을 거치는 추론을 의미하는 것으로, GPT-4.5는 추론하지 않는 마지막 모델이 될 것이라는 의미다.

오픈AI는 GPT-4.5가 "지금까지 대화형 모델 중 가장 크고 강력"하다며 패턴을 인식하고 연관성을 찾으며 논리적 추론 없이도 창의적인 통찰을 생성하는 능력이 향상됐다"고 강조했다.

새 모델은 더욱 광범위한 지식과 사용자 의도를 이해하는 능력, 특히 감성지능(EQ) 향상으로 한층 더 사람처럼 자연스러운 대화가 가능하다고 오픈AI측은 밝혔다.

오픈AI는 이를 통해 글쓰기를 개선하고 프로그래밍과 실용적인 문제 해결과 같은 작업에서 새 모델이 매우 유용하게 활용되고, 환각(hallucination·할루시네이션)은 감소할 것으로 예상된다고 설명했다.

'환각'이란 생성형 AI가 사실과 다른 정보를 내놓거나, 맥락과 관련없는 부정확한 정보를 내놓는 오류현상을 말한다.

GPT-4.5는 또 검색을 통해 최신 정보를 이용하고, 파일 및 이미지 업로드를 지원하며, 캔버스를 사용해 글쓰기 및 코딩 작업을 수행한다.

Q&A 정확도
[오픈AI 제공]


오픈AI는 GPT-4.5를 직전 모델인 'GPT-4o'와 최근 출시한 추론 모델인 'o3-미니'를 비교했다.

간단한 질문에 대한 답의 정확도는 GPT-4.5(62.5%)가 GPT-4o(38.6%), o3-미니(15.0%)보다 높았고 환각율(37.1%)도 GPT-4o(59.8%), o3-미니(80.3%)보다 낮았다.

AI 모델 벤치마크 테스트에서는 수학과 과학 등 4개 전 부문에서 GPT-4o를 능가했다. o3-미니보다는 언어와 멀티모달은 앞섰고 과학과 수학은 떨어졌다.

"시험에 떨어져 힘든 시간을 보내고 있다"고 하면 GPT-4o는 "정말 안타까워. 혹시 도움이 될 만한 몇 가지를 생각해볼 수 있을 것 같아"라며 몇 가지를 제시한다.

o3-미니는 "많이 지치고 답답한 기분일 것 같은데, 그건 너무나도 당연한 감정"이라면서 '시험 결과에 영향을 준 요인이 무엇이었는지' 등의 질문을 스스로 던져볼 수 있다고 답한다.

GPT-4.5는 "아이고(aw), 정말 안타까워. 시험에 실패하면 많이 속상하고 낙담할 수 있지만, 그것이 당신의 능력이나 가치를 결정하는 것은 아니야. 혹시 무슨 일이 있었는지 이야기하고 싶은지 아니면 그냥 기분 전환이 필요한지, 어떤 것이든 내가 여기 있을게"라며 이용자의 마음을 더 헤아리는 답변을 내놓는다.

GPT-4.5는 월 200달러 요금제의 챗GPT 프로에 우선 제공된다.

오픈AI는 "현재로서는 상당한 컴퓨팅이 필요하다"며 "우리는 더 넓은 지식, 더 강력한 직관, 더 큰 EQ 등 고유한 강점을 미래 모델의 모든 사용자에게 제공하기 위해 적극적으로 노력하고 있다"고 밝혔다.

AI 모델 벤치마크 평가
[오픈AI 제공]


[email protected]

연합뉴스

번호 제목 글쓴이 날짜
48538 윤석열 파면 땐…최상목 ‘거부’도 여당 ‘단일대오’도 흔들린다 랭크뉴스 2025.02.28
48537 [단독] 새마을금고, 지난해 적자 1조7000억원… “금고 10개 중 9개 손실” 랭크뉴스 2025.02.28
48536 트럼프 “중국에 또 10% 관세” 예고에 증시 하락…S&P500 1.59%↓[데일리국제금융시장] 랭크뉴스 2025.02.28
48535 [속보] 북 "서해에서 전략순항미사일 발사훈련‥핵억제력 신뢰성 과시" 랭크뉴스 2025.02.28
48534 [속보] 북 "서해에서 전략순항미사일 발사훈련…핵억제력 신뢰성 과시" 랭크뉴스 2025.02.28
48533 '티격태격' 감사원·선관위 악연, 헌재 판결로 일단락...두 기관의 개혁은 과제로 랭크뉴스 2025.02.28
48532 한국, 민주주의 22위→32위… '결함 있는 민주주의'로 강등 랭크뉴스 2025.02.28
48531 [단독] 한동훈 "대통령 당선되면 개헌, 3년 뒤 물러나겠다" 랭크뉴스 2025.02.28
48530 신종 코로나 또 등장? 103일 된 영아가 폐렴…간수치 10배 뛰어 랭크뉴스 2025.02.28
48529 [단독] 與 실세 의원 아들, 강남서 '던지기'로 마약 찾다가 적발 랭크뉴스 2025.02.28
48528 손바닥 뒤집듯…트럼프 "내가 젤렌스키를 독재자라고 했다고?" 랭크뉴스 2025.02.28
48527 엔비디아, 예상치 상회한 4분기 실적에도 환호 없는 까닭 랭크뉴스 2025.02.28
48526 中企 경기전망지수 5개월 만에 반등 랭크뉴스 2025.02.28
48525 다시 최상목의 시간... ①마은혁 임명 ②명태균 특검 ③한덕수 복귀 랭크뉴스 2025.02.28
48524 고삐 죄는 당국…1억 미만·중도금 대출도 소득 따진다 랭크뉴스 2025.02.28
48523 美 해군장관 후보 "한화의 美 조선소 인수 따른 기술 유입 중요"(종합) 랭크뉴스 2025.02.28
48522 유튜브 나온 하나금융 회장 "주가 열심히 끌어올리겠다" 랭크뉴스 2025.02.28
48521 [단독] 정청래 "尹 공약" 뭉갠 법안…알고보니 이재명도 공약 랭크뉴스 2025.02.28
48520 [단독] 명태균에 공공기관장 유임 청탁도… 국정·인사 실세였나, 숟가락만 얹었나 랭크뉴스 2025.02.28
48519 딸기 한 팩 6만5000원… 초 프리미엄 ‘신세계마켓’ 열렸다 랭크뉴스 2025.02.28