Hospedagem do Agent SDK
O Claude Agent SDK difere das APIs LLM tradicionais sem estado, pois mantém o estado conversacional e executa comandos em um ambiente persistente. Este guia aborda a arquitetura, considerações de hospedagem e melhores práticas para implantar agentes baseados em SDK em produção.Compreendendo a Arquitetura do SDK
Modelo de Processo de Longa Duração
Ao contrário das chamadas de API sem estado, o Claude Agent SDK opera como um processo de longa duração que:- Executa comandos em um ambiente shell persistente
- Gerencia operações de arquivo dentro de um diretório de trabalho
- Lida com execução de ferramentas com contexto de interações anteriores
Requisitos de Hospedagem
Sandboxing Baseado em Container
Para segurança e isolamento, o SDK deve ser executado dentro de um ambiente de container sandboxed. Isso fornece:- Isolamento de processo - Ambiente de execução separado por sessão
- Limites de recursos - Restrições de CPU, memória e armazenamento
- Controle de rede - Restringir conexões de saída
- Sistemas de arquivos efêmeros - Estado limpo para cada sessão
Requisitos do Sistema
Cada instância do SDK requer:-
Dependências de runtime
- Python 3.10+ (para Python SDK) ou Node.js 18+ (para TypeScript SDK)
- Node.js (requerido pelo Claude Code CLI)
- Claude Code CLI:
npm install -g @anthropic-ai/claude-code
-
Alocação de recursos
- Recomendado: 1GiB RAM, 5GiB de disco e 1 CPU (varie isso baseado na sua tarefa conforme necessário)
-
Acesso à rede
- HTTPS de saída para
api.anthropic.com
- Opcional: Acesso a servidores MCP ou ferramentas externas
- HTTPS de saída para
Opções de Provedores de Sandbox
Vários provedores se especializam em ambientes de container seguros para execução de código AI:Padrões de Implantação em Produção
Padrão 1: Sessões Efêmeras
Criar um novo container para cada tarefa do usuário, depois destruí-lo quando completo. Melhor para tarefas pontuais, o usuário ainda pode interagir com a AI enquanto a tarefa está sendo completada, mas uma vez completada o container é destruído. Exemplos:- Investigação e Correção de Bug: Depurar e resolver um problema específico com contexto relevante
- Processamento de Fatura: Extrair e estruturar dados de recibos/faturas para sistemas de contabilidade
- Tarefas de Tradução: Traduzir documentos ou lotes de conteúdo entre idiomas
- Processamento de Imagem/Vídeo: Aplicar transformações, otimizações ou extrair metadados de arquivos de mídia
Padrão 2: Sessões de Longa Duração
Manter instâncias de container persistentes para tarefas de longa duração. Frequentemente executando múltiplos processos Claude Agent dentro do container baseado na demanda. Melhor para agentes proativos que tomam ação sem a entrada do usuário, agentes que servem conteúdo ou agentes que processam grandes quantidades de mensagens. Exemplos:- Agente de Email: Monitora emails recebidos e autonomamente triagem, responde ou toma ações baseadas no conteúdo
- Construtor de Site: Hospeda sites customizados por usuário com capacidades de edição ao vivo servidas através de portas do container
- Chat Bots de Alta Frequência: Lida com fluxos contínuos de mensagens de plataformas como Slack onde tempos de resposta rápidos são críticos
Padrão 3: Sessões Híbridas
Containers efêmeros que são hidratados com histórico e estado, possivelmente de um banco de dados ou dos recursos de retomada de sessão do SDK. Melhor para containers com interação intermitente do usuário que inicia trabalho e desliga quando o trabalho é completado mas pode ser continuado. Exemplos:- Gerente de Projeto Pessoal: Ajuda a gerenciar projetos em andamento com check-ins intermitentes, mantém contexto de tarefas, decisões e progresso
- Pesquisa Profunda: Conduz tarefas de pesquisa de múltiplas horas, salva descobertas e retoma investigação quando o usuário retorna
- Agente de Suporte ao Cliente: Lida com tickets de suporte que abrangem múltiplas interações, carrega histórico de tickets e contexto do cliente
Padrão 4: Containers Únicos
Executar múltiplos processos Claude Agent SDK em um container global. Melhor para agentes que devem colaborar estreitamente juntos. Este é provavelmente o padrão menos popular porque você terá que prevenir que agentes sobrescrevam uns aos outros. Exemplos:- Simulações: Agentes que interagem uns com os outros em simulações como videogames.
FAQ
Como me comunico com meus sandboxes?
Ao hospedar em containers, exponha portas para se comunicar com suas instâncias SDK. Sua aplicação pode expor endpoints HTTP/WebSocket para clientes externos enquanto o SDK executa internamente dentro do container.Qual é o custo de hospedar um container?
Descobrimos que o custo dominante de servir agentes são os tokens, containers variam baseado no que você provisiona mas um custo mínimo é aproximadamente 5 centavos por hora executando.Quando devo desligar containers ociosos vs. mantê-los aquecidos?
Isso é provavelmente dependente do provedor, diferentes provedores de sandbox permitirão que você defina diferentes critérios para timeouts de ociosidade após os quais um sandbox pode desligar. Você vai querer ajustar esse timeout baseado na frequência que você pensa que a resposta do usuário pode ser.Com que frequência devo atualizar o Claude Code CLI?
O Claude Code CLI é versionado com semver, então quaisquer mudanças que quebrem compatibilidade serão versionadas.Como monitoro a saúde do container e performance do agente?
Como containers são apenas servidores, a mesma infraestrutura de logging que você usa para o backend funcionará para containers.Por quanto tempo uma sessão de agente pode executar antes de dar timeout?
Uma sessão de agente não dará timeout, mas recomendamos definir uma propriedade ‘maxTurns’ para prevenir que Claude fique preso em um loop.Próximos Passos
- Guia de Sessões - Aprenda sobre gerenciamento de sessão
- Permissões - Configure permissões de ferramentas
- Rastreamento de Custos - Monitore uso da API
- Integração MCP - Estenda com ferramentas customizadas