Claude dans Microsoft Foundry

Ce guide vous expliquera le processus de configuration et d’effectuation d’appels API à Claude dans Foundry en Python, TypeScript ou en utilisant des requêtes HTTP directes. Lorsque vous pouvez accéder à Claude dans Foundry, vous serez facturé pour l’utilisation de Claude sur la Place de marché Microsoft avec votre abonnement Azure, ce qui vous permet d’accéder aux dernières capacités de Claude tout en gérant les coûts via votre abonnement Azure. Disponibilité régionale : Au lancement, Claude est disponible en tant que type de déploiement Global Standard dans les ressources Foundry avec la zone de données US à venir bientôt. La tarification de Claude sur la Place de marché Microsoft utilise la tarification API standard d’Anthropic. Visitez notre page de tarification pour plus de détails.

Aperçu

Dans cette intégration de plateforme en aperçu, les modèles Claude s’exécutent sur l’infrastructure d’Anthropic. Il s’agit d’une intégration commerciale pour la facturation et l’accès via Azure. En tant que processeur indépendant pour Microsoft, les clients utilisant Claude via Microsoft Foundry sont soumis aux conditions d’utilisation des données d’Anthropic. Anthropic continue de fournir ses engagements en matière de sécurité et de données de premier plan, y compris la disponibilité de zéro rétention de données.

Conditions préalables

Avant de commencer, assurez-vous que vous avez :

Un abonnement Azure actif
Accès à Foundry
L’interface de ligne de commande Azure installée (facultatif, pour la gestion des ressources)

Installer un SDK

Les SDK clients d’Anthropic prennent en charge Foundry via des packages spécifiques à la plateforme.

# Python
pip install -U "anthropic"

# Typescript
npm install @anthropic-ai/foundry-sdk

Approvisionnement

Foundry utilise une hiérarchie à deux niveaux : les ressources contiennent votre configuration de sécurité et de facturation, tandis que les déploiements sont les instances de modèle que vous appelez via l’API. Vous allez d’abord créer une ressource Foundry, puis créer un ou plusieurs déploiements Claude dans celle-ci.

Approvisionnement des ressources Foundry

Créez une ressource Foundry, qui est requise pour utiliser et gérer les services dans Azure. Vous pouvez suivre ces instructions pour créer une ressource Foundry. Alternativement, vous pouvez commencer par créer un projet Foundry, ce qui implique de créer une ressource Foundry. Pour approvisionner votre ressource :

Accédez au portail Foundry
Créez une nouvelle ressource Foundry ou sélectionnez-en une existante
Configurez la gestion des accès en utilisant les clés API émises par Azure ou Entra ID pour le contrôle d’accès basé sur les rôles
Configurez éventuellement la ressource pour faire partie d’un réseau privé (Réseau virtuel Azure) pour une sécurité renforcée
Notez le nom de votre ressource—vous l’utiliserez comme {resource} dans les points de terminaison API (par exemple, https://{resource}.services.ai.azure.com/anthropic/v1/*)

Création de déploiements Foundry

Après avoir créé votre ressource, déployez un modèle Claude pour le rendre disponible pour les appels API :

Dans le portail Foundry, accédez à votre ressource
Allez à Modèles + points de terminaison et sélectionnez + Déployer le modèle > Déployer le modèle de base
Recherchez et sélectionnez un modèle Claude (par exemple, claude-sonnet-4-5)
Configurez les paramètres de déploiement :
- Nom du déploiement : Par défaut, c’est l’ID du modèle, mais vous pouvez le personnaliser (par exemple, my-claude-deployment). Le nom du déploiement ne peut pas être modifié après sa création.
- Type de déploiement : Sélectionnez Global Standard (recommandé pour Claude)
Sélectionnez Déployer et attendez que l’approvisionnement soit terminé
Une fois déployé, vous pouvez trouver l’URL de votre point de terminaison et les clés sous Clés et point de terminaison

Le nom du déploiement que vous choisissez devient la valeur que vous transmettez dans le paramètre model de vos requêtes API. Vous pouvez créer plusieurs déploiements du même modèle avec des noms différents pour gérer des configurations ou des limites de débit séparées.

Authentification

Claude sur Foundry prend en charge deux méthodes d’authentification : les clés API et les jetons Entra ID. Les deux méthodes utilisent des points de terminaison hébergés par Azure au format https://{resource}.services.ai.azure.com/anthropic/v1/*.

Authentification par clé API

Après avoir approvisionné votre ressource Claude Foundry, vous pouvez obtenir une clé API à partir du portail Foundry :

Accédez à votre ressource dans le portail Foundry
Allez à la section Clés et point de terminaison
Copiez l’une des clés API fournies
Utilisez soit l’en-tête api-key soit x-api-key dans vos requêtes

Les SDK Python et TypeScript nécessitent une clé API et un nom de ressource. Les SDK liront automatiquement ces informations à partir des variables d’environnement ANTHROPIC_FOUNDRY_API_KEY et ANTHROPIC_FOUNDRY_RESOURCE si elles sont définies. Exemple utilisant une clé API :

import os
from anthropic import AnthropicFoundry

client = AnthropicFoundry(
    api_key=os.environ.get("ANTHROPIC_FOUNDRY_API_KEY"),
    resource_name="{resource}",
)

message = client.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello!"}]
)
print(message.content)

Gardez vos clés API sécurisées. Ne les validez jamais dans le contrôle de version et ne les partagez pas publiquement. Quiconque ayant accès à votre clé API peut faire des requêtes à Claude via votre ressource Foundry.

Authentification Microsoft Entra

Pour une sécurité renforcée et une gestion centralisée des accès, vous pouvez utiliser les jetons Entra ID (anciennement Azure Active Directory) :

Activez l’authentification Entra pour votre ressource Foundry
Obtenez un jeton d’accès à partir d’Entra ID
Utilisez le jeton dans l’en-tête Authorization: Bearer {TOKEN}

Exemple utilisant Entra ID :

import os
from anthropic import AnthropicFoundry
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

# Obtenez le jeton Entra ID Azure en utilisant le modèle de fournisseur de jetons
token_provider = get_bearer_token_provider(
    DefaultAzureCredential(),
    "https://cognitiveservices.azure.com/.default"
)

# Créez un client avec l'authentification Entra ID
client = AnthropicFoundry(
    resource_name="{resource}",  # Votre nom de ressource Azure
    azure_ad_token_provider=token_provider  # Utilisez le fournisseur de jetons pour l'authentification Entra ID
)

# Effectuez une requête
message = client.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello!"}]
)
print(message.content)

L’authentification Azure Entra ID vous permet de gérer l’accès en utilisant Azure RBAC, d’intégrer la gestion des identités de votre organisation et d’éviter de gérer manuellement les clés API.

Remplacez {resource} par le nom réel de votre ressource Azure. Vous pouvez utiliser soit l’en-tête api-key (montré ci-dessus) soit l’en-tête x-api-key - les deux sont pris en charge.

Installer un SDK

Les SDK clients d’Anthropic prennent en charge Foundry via des packages spécifiques à la plateforme.

# Python
pip install -U "anthropic"

# Typescript
npm install @anthropic-ai/foundry-sdk

Paramètre de modèle et déploiements

Le paramètre de modèle dans vos requêtes API accepte les noms de déploiement. Le nom par défaut suggéré pour les déploiements est l’ID du modèle (par exemple, claude-sonnet-4-5), mais vous pouvez personnaliser les noms de déploiement dans le portail Foundry (au moment de la création du déploiement uniquement). Exemple avec un déploiement personnalisé :

# Si vous avez créé un déploiement personnalisé nommé "my-claude-deployment"
message = client.messages.create(
    model="my-claude-deployment",  # Votre nom de déploiement personnalisé
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello!"}]
)

Les déploiements vous permettent de gérer différentes configurations de modèles, versions ou limites de débit via Azure sans modifier votre code d’application. Consultez nos SDK clients pour plus de détails, et la documentation officielle de Foundry ici.

ID de requête de corrélation

Foundry inclut des identifiants de requête dans les en-têtes de réponse HTTP pour le débogage et le traçage. Lorsque vous contactez le support, fournissez à la fois les valeurs request-id et apim-request-id pour aider les équipes à localiser et enquêter rapidement sur votre requête dans les systèmes d’Anthropic et d’Azure.

Fonctionnalités prises en charge

Claude sur Foundry prend en charge la plupart des puissantes fonctionnalités de Claude. Vous pouvez trouver toutes les fonctionnalités actuellement prises en charge ici.

Fonctionnalités non prises en charge

API Admin (/v1/organizations/* points de terminaison)
API Modèles (/v1/models)
API Batch de messages (/v1/messages/batches)

Réponses API

Les réponses API de Claude sur Foundry suivent le format de réponse API Anthropic standard. Cela inclut l’objet usage dans les corps de réponse, qui fournit des informations détaillées sur la consommation de jetons pour vos requêtes. L’objet usage est cohérent sur toutes les plateformes (API propriétaire, Foundry, Amazon Bedrock et Google Vertex AI). Pour plus de détails sur les en-têtes de réponse spécifiques à Foundry, consultez la section ID de requête de corrélation.

ID de modèle API et déploiements

Les modèles Claude suivants sont disponibles via Foundry. Les modèles de dernière génération (Sonnet 4.5, Opus 4.1 et Haiku 4.5) offrent les capacités les plus avancées :

Modèle	Nom de déploiement par défaut
Claude Sonnet 4.5	`claude-sonnet-4-5`
Claude Opus 4.1	`claude-opus-4-1`
Claude Haiku 4.5	`claude-haiku-4-5`

Par défaut, les noms de déploiement correspondent aux ID de modèle affichés ci-dessus. Cependant, vous pouvez créer des déploiements personnalisés avec des noms différents dans le portail Foundry pour gérer différentes configurations, versions ou limites de débit. Utilisez le nom du déploiement (pas nécessairement l’ID du modèle) dans vos requêtes API.

Surveillance et journalisation

Azure fournit des capacités complètes de surveillance et de journalisation pour votre utilisation de Claude via des modèles Azure standard :

Azure Monitor : Suivez l’utilisation de l’API, la latence et les taux d’erreur
Azure Log Analytics : Interrogez et analysez les journaux de requête/réponse
Gestion des coûts : Surveillez et prévoyez les coûts associés à l’utilisation de Claude

Anthropic recommande de journaliser votre activité sur au moins une base glissante de 30 jours pour comprendre les modèles d’utilisation et enquêter sur les problèmes potentiels.

Les services de journalisation d’Azure sont configurés dans votre abonnement Azure. L’activation de la journalisation ne donne pas à Microsoft ou à Anthropic accès à votre contenu au-delà de ce qui est nécessaire pour la facturation et l’exploitation du service.

Dépannage

Erreurs d’authentification

Erreur : 401 Unauthorized ou Invalid API key

Solution : Vérifiez que votre clé API est correcte. Vous pouvez obtenir une nouvelle clé API à partir du portail Azure sous Clés et point de terminaison pour votre ressource Claude.
Solution : Si vous utilisez Azure Entra ID, assurez-vous que votre jeton d’accès est valide et n’a pas expiré. Les jetons expirent généralement après 1 heure.

Erreur : 403 Forbidden

Solution : Votre compte Azure peut manquer des autorisations nécessaires. Assurez-vous que vous avez le rôle Azure RBAC approprié assigné (par exemple, « Utilisateur OpenAI des services cognitifs »).

Limitation de débit

Erreur : 429 Too Many Requests

Solution : Vous avez dépassé votre limite de débit. Implémentez une logique de backoff exponentiel et de nouvelle tentative dans votre application.
Solution : Envisagez de demander des augmentations de limite de débit via le portail Azure ou le support Azure.

En-têtes de limite de débit

Foundry n’inclut pas les en-têtes de limite de débit standard d’Anthropic (anthropic-ratelimit-tokens-limit, anthropic-ratelimit-tokens-remaining, anthropic-ratelimit-tokens-reset, anthropic-ratelimit-input-tokens-limit, anthropic-ratelimit-input-tokens-remaining, anthropic-ratelimit-input-tokens-reset, anthropic-ratelimit-output-tokens-limit, anthropic-ratelimit-output-tokens-remaining et anthropic-ratelimit-output-tokens-reset) dans les réponses. Gérez la limitation de débit via les outils de surveillance d’Azure à la place.

Erreurs de modèle et de déploiement

Erreur : Model not found ou Deployment not found

Solution : Vérifiez que vous utilisez le nom de déploiement correct. Si vous n’avez pas créé de déploiement personnalisé, utilisez l’ID de modèle par défaut (par exemple, claude-sonnet-4-5).
Solution : Assurez-vous que le modèle/déploiement est disponible dans votre région Azure.

Erreur : Invalid model parameter

Solution : Le paramètre de modèle doit contenir votre nom de déploiement, qui peut être personnalisé dans le portail Foundry. Vérifiez que le déploiement existe et est correctement configuré.

Ressources supplémentaires

Documentation Foundry : ai.azure.com/catalog
Tarification Azure : azure.microsoft.com/en-us/pricing
Détails de tarification Anthropic : Documentation de tarification
Guide d’authentification : Consultez la section authentification ci-dessus
Portail Azure : portal.azure.com

Premiers pas

Modèles et tarification

Créer avec Claude

Capacités

Outils

Compétences de l'Agent

SDK Agent

MCP dans l'API

Claude sur les plateformes tierces

Ingénierie des prompts

Tester et évaluer

Renforcer les garde-fous

Administration et surveillance

Claude dans Microsoft Foundry

Aperçu

Conditions préalables

Installer un SDK

Approvisionnement

Approvisionnement des ressources Foundry

Création de déploiements Foundry

Authentification

Authentification par clé API

Authentification Microsoft Entra

Installer un SDK

Paramètre de modèle et déploiements

ID de requête de corrélation

Fonctionnalités prises en charge

Fonctionnalités non prises en charge

Réponses API

ID de modèle API et déploiements

Surveillance et journalisation

Dépannage

Erreurs d’authentification

Limitation de débit

En-têtes de limite de débit

Erreurs de modèle et de déploiement

Ressources supplémentaires

Premiers pas

Modèles et tarification

Créer avec Claude

Capacités

Outils

Compétences de l'Agent

SDK Agent

MCP dans l'API

Claude sur les plateformes tierces

Ingénierie des prompts

Tester et évaluer

Renforcer les garde-fous

Administration et surveillance

​Aperçu

​Conditions préalables

​Installer un SDK

​Approvisionnement

​Approvisionnement des ressources Foundry

​Création de déploiements Foundry

​Authentification

​Authentification par clé API

​Authentification Microsoft Entra

​Installer un SDK

​Paramètre de modèle et déploiements

​ID de requête de corrélation

​Fonctionnalités prises en charge

​Fonctionnalités non prises en charge

​Réponses API

​ID de modèle API et déploiements

​Surveillance et journalisation

​Dépannage

​Erreurs d’authentification

​Limitation de débit

​En-têtes de limite de débit

​Erreurs de modèle et de déploiement

​Ressources supplémentaires

Aperçu

Conditions préalables

Installer un SDK

Approvisionnement

Approvisionnement des ressources Foundry

Création de déploiements Foundry

Authentification

Authentification par clé API

Authentification Microsoft Entra

Installer un SDK

Paramètre de modèle et déploiements

ID de requête de corrélation

Fonctionnalités prises en charge

Fonctionnalités non prises en charge

Réponses API

ID de modèle API et déploiements

Surveillance et journalisation

Dépannage

Erreurs d’authentification

Limitation de débit

En-têtes de limite de débit

Erreurs de modèle et de déploiement

Ressources supplémentaires