GPT-5.2 공개: 전문가 수준의 AI, 비즈니스 혁신을 이끌까?
오픈AI가 차세대 AI 모델 GPT-5.2를 공개하며 다시 한번 AI 기술의 혁신을 예고했습니다. GPT-5.1 대비 향상된 성능과 함께 다양한 비즈니스 과제 수행 능력이 더욱 강화되었다고 하는데요. 이번 블로그 글에서는 GPT-5.2의 주요 특징과 개선점, 그리고 실제 비즈니스 환경에 미칠 영향에 대해 자세히 알아보겠습니다.
GPT-5.2, 3가지 성능 티어로 제공
GPT-5.2는 인스턴트, 씽킹, 프로의 3가지 성능 티어로 제공됩니다. 각 티어는 사용자의 요구에 따라 즉각적인 답변, 심층적인 사고 능력, 연구 수준의 정보 제공 등 다양한 기능을 제공합니다. 오픈AI는 GPT-5.2가 다양한 벤치마크에서 이전 모델 대비 대폭 개선된 성능을 보였다고 밝혔습니다.
GDP밸 벤치마크, 인간 전문가 수준의 수행 능력 입증
오픈AI의 자체 벤치마크인 GDP밸에서 GPT-5.2는 44개의 비즈니스 과제를 인간 전문가와 동일한 수준으로 수행하는 테스트에서 70.9%의 일치율을 기록했습니다. 이는 GPT-5.1의 38.8% 대비 약 2배 가까이 향상된 수치입니다. 특히, GPT-5.2 씽킹 모델은 인력 계획용 스프레드시트를 완전한 서식 형태로 작성할 수 있는 능력을 보여주며 실제 업무 환경에서의 활용 가능성을 높였습니다.
비즈니스 가치 극대화를 위한 설계
오픈AI는 GPT-5.2가 사용자에게 더 큰 경제적 가치를 제공하기 위해 설계되었다고 강조합니다. 스프레드시트 작성, 프레젠테이션 제작, 코드 작성, 이미지 인식, 긴 맥락 이해, 툴 활용, 복잡한 다단계 프로젝트 수행 등 다양한 분야에서 이전 모델 대비 향상된 성능을 제공합니다. 이는 기업들이 GPT-5.2를 통해 업무 효율성을 높이고 새로운 비즈니스 기회를 창출할 수 있음을 시사합니다.
주요 벤치마크 성능 향상
GPT-5.2는 ARC-AGI-1, ARC-AGI-2와 같은 일반 문제 해결 능력 평가와 SWE-벤치 프로/베리파이드 테스트에서 향상된 결과를 보였습니다. 이러한 개선은 코드 디버깅, 기능 구현, 대규모 코드 리팩터링, 엔드 투 엔드 수정 작업 등 실제 소프트웨어 개발 작업 수행 능력이 더욱 안정적으로 향상되었음을 의미합니다.
구독 요금 및 API 가격 정보
GPT-5.2는 현재 챗GPT 유료 이용자부터 순차적으로 배포가 시작되었으며, 구독 요금은 이전과 동일합니다. API를 통해 사용할 경우, 입력 토큰 100만 개당 1.75달러, 출력 토큰 100만 개당 14달러의 요금이 책정되었습니다. 캐시된 입력 토큰에는 90%의 할인율이 적용됩니다. GPT-5.1보다 단가가 다소 높지만, 오픈AI는 GPT-5.2의 토큰 효율성이 높아 동일한 품질 수준을 얻는 데 실제 비용은 오히려 더 낮아졌다고 설명합니다.
코드 레드 해소, GPT-5 개발 속도 가속화
오픈AI는 이번 신형 모델의 빠른 등장을 통해 GPT-5 개발 속도가 크게 가속화되었음을 보여주었습니다. 얼마 전까지 회사 내부에서는 구글의 제미나이 3에 뒤처질 수 있다는 위기감이 감돌았지만, 현재는 다소 안정세를 찾은 것으로 보입니다. 샘 알트먼 CEO는 제미나이의 발전이 예상보다 위협적이지 않았다고 언급하며 코드 레드 상태가 곧 종료될 것이라고 밝혔습니다.
벤치마크의 한계점과 실제 사용자의 평가
지멘스의 AI 애널리스트 마리아 수카레바는 오픈AI의 벤치마크 활용 방식에 의문을 제기하며, GPT-5.2가 어떤 데이터로 학습되었는지 공개되지 않은 상태에서 제시된 수치는 의미가 없다고 지적했습니다. 반면, 전자상거래 플랫폼 Sell The Trend의 CEO 라시드 웨비는 실제 환경에서 GPT-5.2를 테스트한 결과 복잡한 문맥 속에서도 논리적 흐름을 더 오래 유지하는 능력이 향상되었다고 평가했습니다.
환각 현상 개선 필요
에이전틱 AI 개발 업체 벡타라의 벤치마크 결과에 따르면, GPT-5.2는 환각 현상 분야에서 개선을 보였지만 여전히 일부 경쟁사보다는 뒤처진 것으로 나타났습니다. 오픈AI는 환각 성능을 개선해야 할 여지가 남아 있으며, 이는 향후 모델 개발의 중요한 과제가 될 것으로 보입니다.
맺음말
GPT-5.2는 분명 이전 모델 대비 향상된 성능과 다양한 기능을 제공하며 비즈니스 혁신에 기여할 가능성을 보여주고 있습니다. 하지만 벤치마크의 한계점과 환각 현상 개선 필요 등 해결해야 할 과제도 남아 있습니다. GPT-5.2가 앞으로 어떻게 발전해 나갈지, 그리고 실제 비즈니스 환경에서 어떤 변화를 가져올지 기대됩니다.