Claude Agent SDK는 기존의 상태 비저장 LLM API와 달리 대화 상태를 유지하고 지속적인 환경에서 명령을 실행합니다. 이 가이드는 프로덕션에서 SDK 기반 에이전트를 배포하기 위한 아키텍처, 호스팅 고려사항 및 모범 사례를 다룹니다.

호스팅 요구사항

컨테이너 기반 샌드박싱

보안과 격리를 위해 SDK는 샌드박스 컨테이너 환경 내에서 실행되어야 합니다. 이는 다음을 제공합니다:
  • 프로세스 격리 - 세션당 별도의 실행 환경
  • 리소스 제한 - CPU, 메모리 및 스토리지 제약
  • 네트워크 제어 - 아웃바운드 연결 제한
  • 임시 파일시스템 - 각 세션에 대한 깨끗한 상태

시스템 요구사항

각 SDK 인스턴스에는 다음이 필요합니다:
  • 런타임 종속성
    • Python 3.10+ (Python SDK의 경우) 또는 Node.js 18+ (TypeScript SDK의 경우)
    • Node.js (Claude Code CLI에 필수)
    • Claude Code CLI: npm install -g @anthropic-ai/claude-code
  • 리소스 할당
    • 권장: 1GiB RAM, 5GiB 디스크 및 1 CPU (작업에 따라 필요에 맞게 조정)
  • 네트워크 액세스
    • api.anthropic.com으로의 아웃바운드 HTTPS
    • 선택사항: MCP 서버 또는 외부 도구에 대한 액세스

SDK 아키텍처 이해

상태 비저장 API 호출과 달리 Claude Agent SDK는 장시간 실행되는 프로세스로 작동합니다:
  • 명령 실행 - 지속적인 셸 환경에서
  • 파일 작업 관리 - 작업 디렉토리 내에서
  • 도구 실행 처리 - 이전 상호작용의 컨텍스트와 함께

샌드박스 제공자 옵션

여러 제공자가 AI 코드 실행을 위한 보안 컨테이너 환경을 전문으로 합니다:

프로덕션 배포 패턴

패턴 1: 임시 세션

각 사용자 작업에 대해 새 컨테이너를 만든 다음 완료되면 삭제합니다. 일회성 작업에 최적이며, 사용자는 작업이 완료되는 동안 AI와 상호작용할 수 있지만 완료되면 컨테이너가 삭제됩니다. 예시:
  • 버그 조사 및 수정: 관련 컨텍스트를 사용하여 특정 문제를 디버그하고 해결
  • 송장 처리: 회계 시스템을 위해 영수증/송장에서 데이터 추출 및 구조화
  • 번역 작업: 언어 간 문서 또는 콘텐츠 배치 번역
  • 이미지/비디오 처리: 미디어 파일에서 변환, 최적화 또는 메타데이터 추출 적용

패턴 2: 장시간 실행 세션

장시간 작업을 위해 지속적인 컨테이너 인스턴스를 유지합니다. 종종 수요에 따라 컨테이너 내에서 여러 Claude Agent 프로세스를 실행합니다. 사용자 입력 없이 조치를 취하는 사전 예방적 에이전트, 콘텐츠를 제공하는 에이전트 또는 많은 양의 메시지를 처리하는 에이전트에 최적입니다. 예시:
  • 이메일 에이전트: 들어오는 이메일을 모니터링하고 콘텐츠에 따라 자동으로 분류, 응답 또는 조치 수행
  • 사이트 빌더: 컨테이너 포트를 통해 제공되는 라이브 편집 기능이 있는 사용자별 맞춤 웹사이트 호스팅
  • 고빈도 채팅봇: Slack과 같은 플랫폼에서 빠른 응답 시간이 중요한 연속 메시지 스트림 처리

패턴 3: 하이브리드 세션

데이터베이스 또는 SDK의 세션 재개 기능에서 가져온 기록 및 상태로 수화된 임시 컨테이너입니다. 사용자의 간헐적인 상호작용이 있는 컨테이너에 최적이며, 작업을 시작하고 작업이 완료되면 종료되지만 계속할 수 있습니다. 예시:
  • 개인 프로젝트 관리자: 간헐적인 체크인으로 진행 중인 프로젝트 관리를 지원하고 작업, 결정 및 진행 상황의 컨텍스트 유지
  • 심층 연구: 수 시간에 걸친 연구 작업 수행, 결과 저장 및 사용자가 돌아올 때 조사 재개
  • 고객 지원 에이전트: 여러 상호작용에 걸친 지원 티켓 처리, 티켓 기록 및 고객 컨텍스트 로드

패턴 4: 단일 컨테이너

하나의 글로벌 컨테이너에서 여러 Claude Agent SDK 프로세스를 실행합니다. 밀접하게 협력해야 하는 에이전트에 최적입니다. 에이전트가 서로를 덮어쓰지 않도록 방지해야 하기 때문에 이것이 가장 인기 없는 패턴일 가능성이 높습니다. 예시:
  • 시뮬레이션: 비디오 게임과 같은 시뮬레이션에서 서로 상호작용하는 에이전트입니다.

FAQ

샌드박스와 어떻게 통신합니까?

컨테이너에서 호스팅할 때 SDK 인스턴스와 통신하기 위해 포트를 노출합니다. 애플리케이션은 외부 클라이언트를 위해 HTTP/WebSocket 엔드포인트를 노출할 수 있으며 SDK는 컨테이너 내에서 내부적으로 실행됩니다.

컨테이너 호스팅 비용은 얼마입니까?

우리는 에이전트 제공의 지배적인 비용이 토큰이라는 것을 발견했으며, 컨테이너는 프로비저닝하는 것에 따라 다르지만 최소 비용은 대략 시간당 5센트입니다.

유휴 컨테이너를 종료해야 할 때와 따뜻하게 유지해야 할 때는 언제입니까?

이것은 제공자에 따라 다를 가능성이 높으며, 다양한 샌드박스 제공자는 유휴 타임아웃에 대해 다양한 기준을 설정할 수 있으며 그 후 샌드박스가 종료될 수 있습니다. 사용자 응답이 얼마나 자주 발생할 것으로 예상되는지에 따라 이 타임아웃을 조정하고 싶을 것입니다.

Claude Code CLI를 얼마나 자주 업데이트해야 합니까?

Claude Code CLI는 semver로 버전이 지정되므로 모든 주요 변경사항이 버전이 지정됩니다.

컨테이너 상태와 에이전트 성능을 어떻게 모니터링합니까?

컨테이너는 단지 서버이므로 백엔드에 사용하는 것과 동일한 로깅 인프라가 컨테이너에서 작동합니다.

에이전트 세션이 타임아웃되기 전에 얼마나 오래 실행될 수 있습니까?

에이전트 세션은 타임아웃되지 않지만 Claude가 루프에 갇히는 것을 방지하기 위해 ‘maxTurns’ 속성을 설정하는 것을 권장합니다.

다음 단계