Claude 컨텍스트 윈도우 메모리 관리 5단계: 장기 대화 토큰 낭비 없애는 실전 설계
Claude API로 장기 대화를 구현하면 컨텍스트 윈도우가 금방 찬다. 요약 기반 메모리, 슬라이딩 윈도우, 벡터 검색을 조합해서 토큰 낭비 없이 대화 품질을 유지하는 방법을 코드와 함께 정리했다.
Claude API로 장기 대화를 구현하면 컨텍스트 윈도우가 금방 찬다. 요약 기반 메모리, 슬라이딩 윈도우, 벡터 검색을 조합해서 토큰 낭비 없이 대화 품질을 유지하는 방법을 코드와 함께 정리했다.
Claude API를 쓸 때 시스템 프롬프트 하나가 응답 품질을 완전히 바꾼다. 실무에서 반복 검증한 7가지 설계 패턴을 코드 예제와 함께 정리했다.
Claude API로 워크플로우를 자동화할 때 어떤 오케스트레이션 패턴을 써야 할까? 프롬프트 체이닝, 라우팅, 병렬화, 오케스트레이터-워커, 평가자-최적화 패턴 5가지를 Python 코드로 직접 구현하고 비교한다.
월 300만 원 나오던 Claude API 비용을 프롬프트 캐싱, 배치 API, 컨텍스트 압축 세 가지 조합으로 90만 원대까지 줄인 과정. 각 기법의 적용 코드와 삽질 기록을 정리했다.