목차
- GPT 5 달라진점 총정리 — 시리즈 전체 스펙 비교
- GPT-5 기본 모델 — 추론 설정과 변형 모델
- GPT-5.5 컨텍스트 윈도우와 도구 통합
- GPT-5 시리즈 가격 체계 비교
- GPT-5 deprecation과 GPT-5.5 마이그레이션
- GPT-5.5 API 엔드포인트와 입출력 제약
- 워크로드별 모델 선택 가이드
- GPT-5 시리즈 활용 시 남은 과제
GPT-5 시리즈가 나온 뒤 API를 쓰는 방식이 얼마나 바뀌었는지 파악하고 있는가? GPT 5 달라진점 총정리가 필요한 이유는 단순하다. GPT-5 기본 모델부터 GPT-5.5까지 컨텍스트 윈도우, 가격, 도구 지원 범위가 버전마다 다르고, 기존 GPT-5는 이미 ‘previous model’로 분류되었기 때문이다. 이 글에서는 2026-04 기준 공식 API 문서에 명시된 스펙만을 근거로 각 모델의 변경사항을 비교한다.
GPT 5 달라진점 총정리 — 시리즈 전체 스펙 비교
GPT-5 시리즈는 기본 모델(gpt-5), 중간 버전(GPT-5.4), 그리고 최신 GPT-5.5까지 스펙이 단계적으로 확장되었다. 가장 큰 변화는 컨텍스트 윈도우 크기와 도구 통합 범위인데, 아래 표에 핵심 수치를 정리했다.
| 항목 | GPT-5 | GPT-5.4 | GPT-5.5 |
|---|---|---|---|
| 컨텍스트 윈도우 | 400,000토큰 | — | 1,050,000토큰 |
| 최대 출력 | 128,000토큰 | — | 128,000토큰 |
| 입력 가격 (/1M) | $1.25 | $2.50 | $5.00 |
| 출력 가격 (/1M) | $10.00 | $15.00 | $30.00 |
| Computer Use | ❌ | — | ✅ |
| Hosted Shell | ❌ | — | ✅ |
| MCP 지원 | — | — | ✅ |
| Fine-tuning | — | — | ❌ |
GPT-5.2, GPT-5.3의 상세 변경 로그는 공식 문서에서 접근이 제한되어 있다. 공식 API 문서에 명시된 모델만 이 글에서 다루는 것이 정확하다.
한 가지 주의할 점이 있다. GPT-5.5는 272K 토큰을 초과하는 입력에 대해 2배 과금이 적용된다. 대용량 문서를 한 번에 넣는 워크로드라면 이 임계값을 반드시 고려해야 하는 구간이다.
GPT-5 기본 모델 — 추론 설정과 변형 모델
GPT-5는 코딩과 에이전트 작업용 추론 모델로 설계되었다. 컨텍스트 윈도우 400,000토큰에 최대 출력 128,000토큰을 지원하며, GPT-5 모델 API 레퍼런스에서 전체 스펙을 확인할 수 있다. 지식 컷오프는 2024-09-30이고, 텍스트·이미지 입력을 받아 텍스트를 출력하는 멀티모달 추론 모델이다. 기본 모델 외에 mini·nano 변형이 함께 제공되어, 작업 복잡도와 예산에 따라 모델 선택 폭이 상당히 넓다.
추론 effort 설정
GPT-5의 특징적인 기능 중 하나가 추론 effort 조절이다. minimal, low, medium, high 네 단계로 설정할 수 있으며, 작업 복잡도에 따라 토큰 소비량을 제어하는 방식이다. 단순 분류 작업에 high를 쓰면 비용만 올라가고, 복잡한 멀티스텝 추론에 minimal을 쓰면 정확도가 떨어지게 된다.
스타트업 환경에서 API 비용을 세밀하게 관리해야 할 때, 이 effort 설정이 실질적인 비용 절감 수단이 되기도 한다. 대규모 조직에서는 일괄적으로 high를 걸어두는 경우가 많지만, 소규모 팀에서는 엔드포인트별로 effort를 다르게 잡는 편이 합리적이다.
mini·nano 변형
GPT-5에는 mini와 nano 변형이 존재한다. mini는 입력 $0.25/1M, nano는 입력 $0.05/1M으로 기본 모델 대비 가격이 크게 낮다. 대량 배치 처리나 실시간 응답이 덜 중요한 파이프라인에 적합한 선택지인 것이다.
분류·요약 같은 단순 작업에는 nano + minimal effort, 코드 생성·에이전트 체인에는 기본 모델 + high effort를 조합하면 비용 대비 품질 균형을 잡을 수 있다.
GPT-5.5(gpt-5.5-2026-04-23)는 2026-04-24에 API로 출시되었다. GPT 5 달라진점 총정리에서 가장 큰 폭의 변화가 이 모델에서 발생했다고 볼 수 있다.
1,050,000토큰 컨텍스트
컨텍스트 윈도우가 1,050,000토큰으로 확장되면서, 대규모 코드베이스나 긴 문서 전체를 한 번에 입력하는 워크플로가 가능해졌다. GPT-5의 400K 대비 2.6배 증가한 수치다. 최대 출력은 128,000토큰으로 동일하게 유지된다.
다만 272K 토큰 초과 입력 시 2배 과금이라는 조건이 있으므로, 실제로 1M 토큰 가까이 사용하면 비용이 상당히 올라가는 편이다. 대용량 입력이 필요한 작업과 그렇지 않은 작업을 분리해서 호출하는 것이 비용 관리의 핵심이 된다.
도구 통합 확장
GPT-5.5는 아래 도구들을 추가로 지원한다:
- Web search — 실시간 웹 검색
- File search — 파일 내 검색
- Code interpreter — 코드 실행 환경
- Computer use — 데스크톱 조작 (GPT-5에는 없던 기능)
- MCP — Model Context Protocol 기반 외부 도구 연결
- Hosted shell — 호스팅된 셸 환경 (GPT-5에는 없던 기능)
Function calling과 Structured outputs도 지원하므로, 기존 GPT-5 기반 에이전트 파이프라인을 GPT-5.5로 전환할 때 함수 호출 인터페이스는 그대로 유지할 수 있다. 다만 Fine-tuning은 미지원이고 Distillation만 가능하다는 점은 주의해야 할 부분이다.
GPT-5.5는 Fine-tuning을 지원하지 않는다. 기존에 GPT-5 계열을 Fine-tuning해서 쓰던 워크로드가 있다면, GPT-5.5로 바로 전환하기 어렵다. Distillation은 지원되므로 이를 대안으로 검토할 필요가 있다.
GPT 5 달라진점 총정리에서 빠질 수 없는 것이 가격이다. 모델별 가격 차이가 크기 때문에, 워크로드에 맞는 모델 선택이 곧 비용 최적화와 직결되는 셈이다. OpenAI 가격 정책 페이지에서 최신 가격을 확인할 수 있다.
| 모델 | 입력 (/1M) | 출력 (/1M) | 용도 |
|---|---|---|---|
| GPT-5 | $1.25 | $10.00 | 범용 추론·코딩 |
| GPT-5 mini | $0.25 | — | 경량 작업 |
| GPT-5 nano | $0.05 | — | 대량 배치 |
| GPT-5.4 | $2.50 | $15.00 | 중간 성능 |
| GPT-5.4-mini | $0.75 | $4.50 | 중간 경량 |
| GPT-5.4-nano | $0.20 | $1.25 | 중간 배치 |
| GPT-5.5 | $5.00 | $30.00 | 최신 에이전트·도구 통합 |
| GPT-5.5-pro | $30.00 | $180.00 | 최고 성능 |
Batch 처리와 Flex 처리를 이용하면 50% 할인이 적용된다. 실시간 응답이 필요 없는 데이터 파이프라인이나 야간 배치 작업에서 이 할인을 적극 활용하면 비용을 절반으로 줄일 수 있다. Regional processing을 선택하면 10% 추가 과금이 발생하므로, 데이터 거주 요건이 없다면 기본 처리를 사용하는 것이 경제적이다.
GPT-5.5-pro의 출력 가격이 $180/1M으로 상당히 높다. 이 모델은 최고 품질이 필요한 특수 케이스에만 쓰는 것이 현실적이고, 일반적인 서비스 운영에는 GPT-5.5 기본 모델이나 GPT-5.4 계열이 비용 효율적이다.
GPT-5.5 기본 모델에 Batch 50% 할인을 적용하면 입력 $2.50/1M, 출력 $15.00/1M이 되어 GPT-5.4 정가와 비슷한 수준이 된다. 실시간성이 불필요한 작업이라면 GPT-5.5 + Batch가 GPT-5.4 정가 사용보다 나은 선택일 때가 있다.
GPT-5 기본 모델은 현재 OpenAI에서 ‘previous model’로 분류되었다. OpenAI는 GPT-5.1 이상 사용을 권장하고 있으며, GPT-5 기본 모델은 computer use와 hosted shell을 지원하지 않는다. 이 두 기능은 GPT-5.5에서 추가된 것이다.
이 deprecation 상태가 당장 API 호출을 차단하지는 않지만, 향후 지원 중단 가능성을 고려하면 마이그레이션 계획을 세워두는 것이 안전하다. 특히 에이전트 워크플로에서 computer use나 MCP를 활용하려면 GPT-5.5로의 전환이 필수적인 상황이다.
마이그레이션 시 체크리스트
마이그레이션에서 가장 먼저 확인할 것은 Fine-tuning 의존도다. GPT-5를 Fine-tuning해서 쓰고 있었다면, GPT-5.5에서는 이 기능이 없으므로 Distillation으로 대체하거나 프롬프트 엔지니어링으로 보완해야 하는 것이다.
두 번째는 비용 변화 추정이다. GPT-5 입력 $1.25에서 GPT-5.5 입력 $5.00으로 4배 차이가 나므로, 현재 월간 API 사용량 기준으로 비용이 얼마나 증가하는지 미리 계산해야 한다. GPT-5.4($2.50)를 중간 단계로 사용하는 것도 선택지다.
세 번째는 컨텍스트 윈도우 활용 방식 재설계다. 400K에서 1,050K로 확장되면서 기존에 청크 분할하던 로직이 불필요해질 수 있고, 오히려 한 번에 전체 입력을 넣는 것이 정확도 면에서 나은 경우가 생기기도 한다. 단, 272K 초과 시 2배 과금이라는 조건을 잊으면 안 된다.
GPT-5.5 API 엔드포인트와 입출력 제약
GPT-5.5는 텍스트와 이미지 입력을 지원하고 텍스트만 출력한다. 오디오와 비디오 입력은 미지원이므로, 멀티모달 파이프라인에서 음성이나 영상을 직접 처리하려면 별도의 전처리 단계가 필요하다.
지원 엔드포인트
사용 가능한 엔드포인트는 네 가지다:
- Chat Completions — 기존 채팅 기반 호출
- Responses API — 구조화된 응답 전용
- Realtime — 실시간 스트리밍
- Batch — 대량 비동기 처리
GPT-5.5 모델 상세 스펙에서 각 엔드포인트별 지원 기능을 확인할 수 있다. Tier 5 기준으로 RPM(분당 요청 수) 15,000, TPM(분당 토큰 수) 40,000,000이 할당되는데, 이는 대규모 서비스에서도 충분한 수준이다.
이 수치를 곧이곧대로 해석하면 안 되는 상황이 있다. 요청당 평균 50,000토큰을 사용한다면, RPM 한도 15,000이 아니라 TPM 40,000,000 기준으로 분당 최대 800건이 실질 상한이 된다. 레이트 리밋 에러(429 Too Many Requests)가 반복된다면 요청 크기를 줄이거나 지수 백오프 재시도 로직을 추가하는 것이 기본 대응이다.
GPT-5.5 API 호출 예제
Chat Completions 엔드포인트 기준 스트리밍 호출 예제다. 대용량 컨텍스트를 넣고 결과를 실시간으로 받을 때 사용하는 패턴이다.
from openai import OpenAI
client = OpenAI()
stream = client.chat.completions.create(
model="gpt-5.5-2026-04-23",
messages=[
{
"role": "system",
"content": "코드 리뷰 전문가다. 개선 사항을 간결하게 제안한다."
},
{
"role": "user",
"content": "아래 코드를 검토해줘.\n\n" + source_code
}
],
stream=True,
max_completion_tokens=4096
)
for chunk in stream:
if chunk.choices[0].delta.content:
print(chunk.choices[0].delta.content, end="", flush=True)
source_code 변수에 최대 1,050,000토큰 분량의 코드베이스를 넣는 것이 가능하다. 단, 272K 초과 시 2배 과금이 적용되므로 실제로는 입력 크기를 사전에 tiktoken 등으로 측정하고 과금 분기점을 확인하는 것이 좋다.
Function calling과 Structured outputs
GPT-5.5는 Function calling과 Structured outputs를 모두 지원한다. 기존 GPT-5 기반으로 만든 함수 호출 스키마를 그대로 재사용할 수 있다는 의미다. 에이전트 파이프라인에서 도구 호출 인터페이스를 새로 설계할 필요가 없는 것이 마이그레이션 부담을 줄여주는 요소가 된다.
다만 Distillation은 가능하지만 Fine-tuning은 불가하다는 점을 다시 강조한다. GPT-5.5의 범용 성능이 충분하다면 Fine-tuning 없이도 운영 가능한 경우가 많지만, 도메인 특화 작업에서 Fine-tuning에 의존하던 워크로드는 전환 전 충분한 테스트가 필요하다.
워크로드별 모델 선택 가이드
GPT 5 달라진점 총정리를 실무에 적용하려면, 워크로드 특성에 따라 어떤 모델을 쓸지 결정해야 한다. 아래는 일반적인 시나리오별 권장 모델이다.
비용 민감형 — 대량 분류·요약
GPT-5.4-nano(입력 $0.20/1M)나 GPT-5 nano(입력 $0.05/1M)가 적합하다. 여기에 Batch 처리 50% 할인을 적용하면 토큰당 비용이 극도로 낮아지는 것이다. 실시간 응답이 필요 없는 로그 분류, 대량 문서 요약, 데이터 라벨링에 이 조합을 쓰면 된다.
균형형 — 일반 서비스 API
GPT-5.4(입력 $2.50/1M)가 가격과 성능의 균형점이 되는 편이다. GPT-5 기본 모델보다 비싸지만 GPT-5.5보다는 저렴하고, 대부분의 챗봇·어시스턴트 워크로드에 충분한 성능을 제공할 때가 많다. 400K 이상의 컨텍스트가 필요 없다면 GPT-5.5까지 갈 이유가 줄어들기도 한다.
에이전트·도구 통합형
Computer use, MCP, Hosted shell이 필요한 에이전트 파이프라인은 GPT-5.5가 유일한 선택지다. 이 기능들은 GPT-5에 없고 GPT-5.5에서 처음 추가되었다. Web search, File search, Code interpreter까지 하나의 모델 호출에서 통합 사용하려면 GPT-5.5를 써야 하는 상황인 것이다.
최고 품질형
GPT-5.5-pro(입력 $30/1M, 출력 $180/1M)는 가격이 GPT-5.5 기본 대비 6배지만, 최고 수준의 추론 품질이 요구되는 법률 문서 분석, 의료 데이터 해석 같은 고부가가치 작업에서 선택할 수 있다. 일반적인 개발 작업에서는 비용 대비 효과가 떨어지는 편이다.
스타트업에서는 GPT-5.4-nano + Batch로 시작해서 점진적으로 상위 모델로 올리는 전략이 현실적이다. 대규모 조직에서는 GPT-5.5를 기본으로 잡고 에이전트 파이프라인에 투자하는 방향이 장기적으로 유리할 때가 있다. 핵심은 워크로드별로 모델을 분리하는 것이다.
GPT-5 시리즈 간 성능 차이를 보여주는 공식 벤치마크 비교표는 공식 문서에 명시되어 있지 않다. GPT-5.5의 agentic coding 구체 예제(코드 스니펫)도 모델 문서에 부재하며, 한국어 공식 가이드 역시 존재하지 않는다. 모든 공식 문서가 영문이므로 API 파라미터명이나 에러 메시지를 영문 기준으로 파악해야 하는 상황이다.
GPT-5.5의 컨텍스트 윈도우 1,050K 토큰은 대규모 코드베이스 분석이나 긴 문서 처리에서 활용 가능성이 크지만, 272K 초과 시 2배 과금이라는 조건이 실질적인 사용 패턴을 제한하게 된다. GPT-5 vs GPT-5.5 비교에서 가장 뚜렷한 차이는 도구 통합(computer use, MCP, hosted shell)이고, 가격 차이는 4배다.
롱 컨텍스트 활용의 실제 제약
컨텍스트를 크게 잡는다고 해서 무조건 정확도가 올라가지는 않는다. 컨텍스트 중간 구간의 정보는 앞뒤 구간에 비해 리콜 정확도가 낮아지는 경향이 실험적으로 보고되어 있다(이른바 ‘lost in the middle’ 현상). 1,050K 전체를 채우더라도 모델이 필요한 정보를 정확히 참조하지 못하는 케이스가 나올 수 있다.
따라서 무조건 컨텍스트를 크게 잡기보다, 관련 청크만 선별해서 넣는 RAG 패턴이 여전히 유효한 구간이 있다. 272K 이하로 입력을 유지하면 2배 과금을 피하면서 충분한 컨텍스트를 확보할 수 있고, 정확도 면에서도 노이즈가 적은 입력이 유리할 때가 많다. 롱 컨텍스트 활용과 RAG 중 어느 쪽이 나은지는 작업 특성과 비용을 함께 측정해서 판단해야 하는 엔지니어링 결정이다.
GPT-5.5 API 사용법을 익힌 뒤에는 MCP 서버 구축을 통한 외부 시스템 연동이 자연스러운 다음 단계가 된다. Anthropic Claude의 에이전트 SDK나 Google Gemini의 도구 통합과 비교하면 각 플랫폼의 에이전트 전략 차이가 드러난다. GPT-5.5 가격이 부담된다면 GPT-5.4 계열로 시작해서 Batch 할인을 적극 활용하는 것이 GPT 5 달라진점 총정리의 실무적 결론이다.
관련 글
- GPT-5 출시 주요 변경사항 7가지 — 모델 라인업·SDK Breaking Change 완전 정리 – GPT-5부터 GPT-5.5까지 모델 라인업, 컨텍스트 윈도우, SDK breaking change를 버전별 비교표와 함께 정리한다. 스타…
- GPT-5 API 사용법 완전 가이드 — Responses API 전환·파라미터 튜닝 7단계 – OpenAI GPT-5는 Responses API를 기본으로 권장하며, verbosity·reasoning_effort 파라미터와 free…
- GPT-5 Codex CLI 사용법 7단계 — 설치·인증·API 호출·에이전트 태스크 완전 정복 – OpenAI Codex CLI 설치, 인증, GPT-5-Codex 모델 API 호출, AGENTS.md 에이전트 태스크 설정, config…