Hébergement du SDK Agent

Le SDK Agent Claude diffère des API LLM traditionnelles sans état en ce qu’il maintient l’état conversationnel et exécute des commandes dans un environnement persistant. Ce guide couvre l’architecture, les considérations d’hébergement et les meilleures pratiques pour déployer des agents basés sur le SDK en production.

Comprendre l’architecture du SDK

Modèle de processus de longue durée

Contrairement aux appels d’API sans état, le SDK Agent Claude fonctionne comme un processus de longue durée qui :

Exécute des commandes dans un environnement shell persistant
Gère les opérations de fichiers dans un répertoire de travail
Gère l’exécution d’outils avec le contexte des interactions précédentes

Exigences d’hébergement

Sandboxing basé sur des conteneurs

Pour la sécurité et l’isolation, le SDK doit s’exécuter dans un environnement de conteneur sandboxé. Cela fournit :

Isolation des processus - Environnement d’exécution séparé par session
Limites de ressources - Contraintes de CPU, mémoire et stockage
Contrôle réseau - Restreindre les connexions sortantes
Systèmes de fichiers éphémères - État propre pour chaque session

Exigences système

Chaque instance SDK nécessite :

Dépendances d’exécution
- Python 3.10+ (pour le SDK Python) ou Node.js 18+ (pour le SDK TypeScript)
- Node.js (requis par Claude Code CLI)
- Claude Code CLI : npm install -g @anthropic-ai/claude-code
Allocation de ressources
- Recommandé : 1 GiB de RAM, 5 GiB de disque et 1 CPU (variez cela selon vos besoins de tâche)
Accès réseau
- HTTPS sortant vers api.anthropic.com
- Optionnel : Accès aux serveurs MCP ou outils externes

Options de fournisseurs de sandbox

Plusieurs fournisseurs se spécialisent dans les environnements de conteneurs sécurisés pour l’exécution de code IA :

Modèles de déploiement en production

Modèle 1 : Sessions éphémères

Créez un nouveau conteneur pour chaque tâche utilisateur, puis détruisez-le une fois terminé. Idéal pour les tâches ponctuelles, l’utilisateur peut toujours interagir avec l’IA pendant que la tâche se termine, mais une fois terminée, le conteneur est détruit. Exemples :

Investigation et correction de bugs : Déboguer et résoudre un problème spécifique avec le contexte pertinent
Traitement de factures : Extraire et structurer les données des reçus/factures pour les systèmes comptables
Tâches de traduction : Traduire des documents ou des lots de contenu entre les langues
Traitement d’images/vidéos : Appliquer des transformations, optimisations ou extraire des métadonnées de fichiers multimédias

Modèle 2 : Sessions de longue durée

Maintenez des instances de conteneurs persistantes pour les tâches de longue durée. Souvent en exécutant plusieurs processus Claude Agent à l’intérieur du conteneur selon la demande. Idéal pour les agents proactifs qui agissent sans l’intervention de l’utilisateur, les agents qui servent du contenu ou les agents qui traitent de grandes quantités de messages. Exemples :

Agent email : Surveille les emails entrants et trie, répond ou prend des actions de manière autonome selon le contenu
Constructeur de site : Héberge des sites web personnalisés par utilisateur avec des capacités d’édition en direct servies via les ports de conteneur
Bots de chat haute fréquence : Gère les flux de messages continus depuis des plateformes comme Slack où les temps de réponse rapides sont critiques

Modèle 3 : Sessions hybrides

Conteneurs éphémères qui sont hydratés avec l’historique et l’état, possiblement depuis une base de données ou depuis les fonctionnalités de reprise de session du SDK. Idéal pour les conteneurs avec une interaction intermittente de l’utilisateur qui déclenche le travail et s’arrête quand le travail est terminé mais peut être continué. Exemples :

Gestionnaire de projet personnel : Aide à gérer les projets en cours avec des vérifications intermittentes, maintient le contexte des tâches, décisions et progrès
Recherche approfondie : Mène des tâches de recherche de plusieurs heures, sauvegarde les découvertes et reprend l’investigation quand l’utilisateur revient
Agent de support client : Gère les tickets de support qui s’étendent sur plusieurs interactions, charge l’historique des tickets et le contexte client

Modèle 4 : Conteneurs uniques

Exécutez plusieurs processus SDK Agent Claude dans un conteneur global. Idéal pour les agents qui doivent collaborer étroitement ensemble. C’est probablement le modèle le moins populaire car vous devrez empêcher les agents de se réécrire mutuellement. Exemples :

Simulations : Agents qui interagissent entre eux dans des simulations comme les jeux vidéo.

FAQ

Comment communiquer avec mes sandboxes ?

Lors de l’hébergement dans des conteneurs, exposez des ports pour communiquer avec vos instances SDK. Votre application peut exposer des points de terminaison HTTP/WebSocket pour les clients externes tandis que le SDK s’exécute en interne dans le conteneur.

Quel est le coût d’hébergement d’un conteneur ?

Nous avons constaté que le coût dominant du service d’agents est les tokens, les conteneurs varient selon ce que vous provisionnez mais un coût minimum est d’environ 5 centimes par heure d’exécution.

Quand dois-je arrêter les conteneurs inactifs vs. les garder chauds ?

Cela dépend probablement du fournisseur, différents fournisseurs de sandbox vous permettront de définir différents critères pour les délais d’inactivité après lesquels un sandbox pourrait s’arrêter. Vous voudrez ajuster ce délai selon la fréquence à laquelle vous pensez que la réponse utilisateur pourrait être.

À quelle fréquence dois-je mettre à jour Claude Code CLI ?

Claude Code CLI est versionné avec semver, donc tout changement cassant sera versionné.

Comment surveiller la santé des conteneurs et les performances des agents ?

Puisque les conteneurs ne sont que des serveurs, la même infrastructure de journalisation que vous utilisez pour le backend fonctionnera pour les conteneurs.

Combien de temps une session d’agent peut-elle s’exécuter avant d’expirer ?

Une session d’agent n’expirera pas, mais nous recommandons de définir une propriété ‘maxTurns’ pour empêcher Claude de rester bloqué dans une boucle.

Prochaines étapes

Guide des sessions - Apprenez la gestion des sessions
Permissions - Configurez les permissions d’outils
Suivi des coûts - Surveillez l’utilisation de l’API
Intégration MCP - Étendez avec des outils personnalisés

Utilisation des API

Référence API

SDKs

Exemples

APIs tierces

Utilisation de l'API Admin

Support et configuration

Hébergement du SDK Agent

Hébergement du SDK Agent

Comprendre l’architecture du SDK

Modèle de processus de longue durée

Exigences d’hébergement

Sandboxing basé sur des conteneurs

Exigences système

Options de fournisseurs de sandbox

Modèles de déploiement en production

Modèle 1 : Sessions éphémères

Modèle 2 : Sessions de longue durée

Modèle 3 : Sessions hybrides

Modèle 4 : Conteneurs uniques

FAQ

Comment communiquer avec mes sandboxes ?

Quel est le coût d’hébergement d’un conteneur ?

Quand dois-je arrêter les conteneurs inactifs vs. les garder chauds ?

À quelle fréquence dois-je mettre à jour Claude Code CLI ?

Comment surveiller la santé des conteneurs et les performances des agents ?

Combien de temps une session d’agent peut-elle s’exécuter avant d’expirer ?

Prochaines étapes

Utilisation des API

Référence API

SDKs

Exemples

APIs tierces

Utilisation de l'API Admin

Support et configuration

​Hébergement du SDK Agent

​Comprendre l’architecture du SDK

​Modèle de processus de longue durée

​Exigences d’hébergement

​Sandboxing basé sur des conteneurs

​Exigences système

​Options de fournisseurs de sandbox

​Modèles de déploiement en production

​Modèle 1 : Sessions éphémères

​Modèle 2 : Sessions de longue durée

​Modèle 3 : Sessions hybrides

​Modèle 4 : Conteneurs uniques

​FAQ

​Comment communiquer avec mes sandboxes ?

​Quel est le coût d’hébergement d’un conteneur ?

​Quand dois-je arrêter les conteneurs inactifs vs. les garder chauds ?

​À quelle fréquence dois-je mettre à jour Claude Code CLI ?

​Comment surveiller la santé des conteneurs et les performances des agents ?

​Combien de temps une session d’agent peut-elle s’exécuter avant d’expirer ?

​Prochaines étapes

Hébergement du SDK Agent

Comprendre l’architecture du SDK

Modèle de processus de longue durée

Exigences d’hébergement

Sandboxing basé sur des conteneurs

Exigences système

Options de fournisseurs de sandbox

Modèles de déploiement en production

Modèle 1 : Sessions éphémères

Modèle 2 : Sessions de longue durée

Modèle 3 : Sessions hybrides

Modèle 4 : Conteneurs uniques

FAQ

Comment communiquer avec mes sandboxes ?

Quel est le coût d’hébergement d’un conteneur ?

Quand dois-je arrêter les conteneurs inactifs vs. les garder chauds ?

À quelle fréquence dois-je mettre à jour Claude Code CLI ?

Comment surveiller la santé des conteneurs et les performances des agents ?

Combien de temps une session d’agent peut-elle s’exécuter avant d’expirer ?

Prochaines étapes