Diese Anleitung führt Sie durch den Prozess der Einrichtung und der API-Aufrufe an Claude in Foundry in Python, TypeScript oder mit direkten HTTP-Anfragen. Wenn Sie auf Claude in Foundry zugreifen können, werden Ihnen die Claude-Nutzungsgebühren über den Microsoft Marketplace mit Ihrem Azure-Abonnement in Rechnung gestellt, sodass Sie auf Claudes neueste Funktionen zugreifen können und gleichzeitig die Kosten über Ihr Azure-Abonnement verwalten können. Regionale Verfügbarkeit: Bei der Einführung ist Claude als Global Standard-Bereitstellungstyp in Foundry-Ressourcen verfügbar, wobei US DataZone in Kürze verfügbar sein wird. Die Preisgestaltung für Claude im Microsoft Marketplace verwendet die Standard-API-Preisgestaltung von Anthropic. Besuchen Sie unsere Preisseite für Details.

Vorschau

In dieser Vorschau-Plattformintegration werden Claude-Modelle auf der Infrastruktur von Anthropic ausgeführt. Dies ist eine kommerzielle Integration für die Abrechnung und den Zugriff über Azure. Als unabhängiger Verarbeiter für Microsoft unterliegen Kunden, die Claude über Microsoft Foundry nutzen, den Datenschutzbestimmungen von Anthropic. Anthropic setzt sich weiterhin für seine branchenführenden Sicherheits- und Datenschutzverpflichtungen ein, einschließlich der Verfügbarkeit von Null-Datenspeicherung.

Voraussetzungen

Bevor Sie beginnen, stellen Sie sicher, dass Sie Folgendes haben:
  • Ein aktives Azure-Abonnement
  • Zugriff auf Foundry
  • Die Azure CLI installiert (optional, für die Ressourcenverwaltung)

Installieren Sie ein SDK

Die Client-SDKs von Anthropic unterstützen Foundry über plattformspezifische Pakete.
# Python
pip install -U "anthropic"

# Typescript
npm install @anthropic-ai/foundry-sdk

Bereitstellung

Foundry verwendet eine zweistufige Hierarchie: Ressourcen enthalten Ihre Sicherheits- und Abrechnungskonfiguration, während Bereitstellungen die Modellinstanzen sind, die Sie über die API aufrufen. Sie erstellen zunächst eine Foundry-Ressource und dann eine oder mehrere Claude-Bereitstellungen darin.

Bereitstellung von Foundry-Ressourcen

Erstellen Sie eine Foundry-Ressource, die erforderlich ist, um Dienste in Azure zu nutzen und zu verwalten. Sie können diese Anweisungen befolgen, um eine Foundry-Ressource zu erstellen. Alternativ können Sie mit der Erstellung eines Foundry-Projekts beginnen, was die Erstellung einer Foundry-Ressource beinhaltet. So stellen Sie Ihre Ressource bereit:
  1. Navigieren Sie zum Foundry-Portal
  2. Erstellen Sie eine neue Foundry-Ressource oder wählen Sie eine vorhandene aus
  3. Konfigurieren Sie die Zugriffsverwaltung mit von Azure ausgegebenen API-Schlüsseln oder Entra ID für rollenbasierte Zugriffskontrolle
  4. Konfigurieren Sie optional die Ressource so, dass sie Teil eines privaten Netzwerks (Azure Virtual Network) ist, um die Sicherheit zu erhöhen
  5. Notieren Sie sich Ihren Ressourcennamen – Sie werden ihn als {resource} in API-Endpunkten verwenden (z. B. https://{resource}.services.ai.azure.com/anthropic/v1/*)

Erstellen von Foundry-Bereitstellungen

Nach der Erstellung Ihrer Ressource stellen Sie ein Claude-Modell bereit, um es für API-Aufrufe verfügbar zu machen:
  1. Navigieren Sie im Foundry-Portal zu Ihrer Ressource
  2. Gehen Sie zu Modelle + Endpunkte und wählen Sie + Modell bereitstellen > Basismodell bereitstellen
  3. Suchen Sie nach einem Claude-Modell und wählen Sie es aus (z. B. claude-sonnet-4-5)
  4. Konfigurieren Sie die Bereitstellungseinstellungen:
    • Bereitstellungsname: Standardmäßig die Modell-ID, aber Sie können ihn anpassen (z. B. my-claude-deployment). Der Bereitstellungsname kann nach der Erstellung nicht mehr geändert werden.
    • Bereitstellungstyp: Wählen Sie Global Standard (empfohlen für Claude)
  5. Wählen Sie Bereitstellen und warten Sie, bis die Bereitstellung abgeschlossen ist
  6. Nach der Bereitstellung finden Sie Ihre Endpunkt-URL und Schlüssel unter Schlüssel und Endpunkt
Der Bereitstellungsname, den Sie wählen, wird zum Wert, den Sie im model-Parameter Ihrer API-Anfragen übergeben. Sie können mehrere Bereitstellungen desselben Modells mit unterschiedlichen Namen erstellen, um separate Konfigurationen oder Ratenlimits zu verwalten.

Authentifizierung

Claude auf Foundry unterstützt zwei Authentifizierungsmethoden: API-Schlüssel und Entra ID-Token. Beide Methoden verwenden Azure-gehostete Endpunkte im Format https://{resource}.services.ai.azure.com/anthropic/v1/*.

API-Schlüssel-Authentifizierung

Nach der Bereitstellung Ihrer Foundry Claude-Ressource können Sie einen API-Schlüssel aus dem Foundry-Portal abrufen:
  1. Navigieren Sie zu Ihrer Ressource im Foundry-Portal
  2. Gehen Sie zum Abschnitt Schlüssel und Endpunkt
  3. Kopieren Sie einen der bereitgestellten API-Schlüssel
  4. Verwenden Sie entweder den api-key- oder x-api-key-Header in Ihren Anfragen
Die Python- und TypeScript-SDKs erfordern einen API-Schlüssel und einen Ressourcennamen. Die SDKs lesen diese automatisch aus den Umgebungsvariablen ANTHROPIC_FOUNDRY_API_KEY und ANTHROPIC_FOUNDRY_RESOURCE, falls diese definiert sind. Beispiel mit API-Schlüssel:
import os
from anthropic import AnthropicFoundry

client = AnthropicFoundry(
    api_key=os.environ.get("ANTHROPIC_FOUNDRY_API_KEY"),
    resource_name="{resource}",
)

message = client.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello!"}]
)
print(message.content)
Halten Sie Ihre API-Schlüssel sicher. Committen Sie sie niemals in die Versionskontrolle und teilen Sie sie nicht öffentlich. Jeder, der Zugriff auf Ihren API-Schlüssel hat, kann Anfragen an Claude über Ihre Foundry-Ressource stellen.

Microsoft Entra-Authentifizierung

Für verbesserte Sicherheit und zentralisierte Zugriffsverwaltung können Sie Entra ID-Token (ehemals Azure Active Directory) verwenden:
  1. Aktivieren Sie die Entra-Authentifizierung für Ihre Foundry-Ressource
  2. Rufen Sie ein Zugriffstoken von Entra ID ab
  3. Verwenden Sie das Token im Authorization: Bearer {TOKEN}-Header
Beispiel mit Entra ID:
import os
from anthropic import AnthropicFoundry
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

# Get Azure Entra ID token using token provider pattern
token_provider = get_bearer_token_provider(
    DefaultAzureCredential(),
    "https://cognitiveservices.azure.com/.default"
)

# Create client with Entra ID authentication
client = AnthropicFoundry(
    resource_name="{resource}",  # Your Azure resource name
    azure_ad_token_provider=token_provider  # Use token provider for Entra ID auth
)

# Make request
message = client.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello!"}]
)
print(message.content)
Die Azure Entra ID-Authentifizierung ermöglicht es Ihnen, den Zugriff mit Azure RBAC zu verwalten, sich in die Identitätsverwaltung Ihrer Organisation zu integrieren und API-Schlüssel nicht manuell zu verwalten.
Ersetzen Sie {resource} durch Ihren tatsächlichen Azure-Ressourcennamen. Sie können entweder den api-key-Header (oben gezeigt) oder den x-api-key-Header verwenden – beide werden unterstützt.

Installieren Sie ein SDK

Die Client-SDKs von Anthropic unterstützen Foundry über plattformspezifische Pakete.
# Python
pip install -U "anthropic"

# Typescript
npm install @anthropic-ai/foundry-sdk

Modellparameter und Bereitstellungen

Der Modellparameter in Ihren API-Anfragen akzeptiert Bereitstellungsnamen. Der Standardname für Bereitstellungen ist die Modell-ID (z. B. claude-sonnet-4-5), aber Sie können Bereitstellungsnamen im Foundry-Portal anpassen (nur zum Zeitpunkt der Bereitstellungserstellung). Beispiel mit benutzerdefinierter Bereitstellung:
# If you've created a custom deployment named "my-claude-deployment"
message = client.messages.create(
    model="my-claude-deployment",  # Your custom deployment name
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello!"}]
)
Bereitstellungen ermöglichen es Ihnen, verschiedene Modellkonfigurationen, Versionen oder Ratenlimits über Azure zu verwalten, ohne Ihren Anwendungscode zu ändern. Weitere Details finden Sie in unseren Client-SDKs und in der offiziellen Foundry-Dokumentation hier.

Korrelations-Request-IDs

Foundry enthält Request-Identifikatoren in HTTP-Antwortheadern zum Debuggen und Tracing. Wenn Sie den Support kontaktieren, geben Sie sowohl die request-id- als auch die apim-request-id-Werte an, um Teams dabei zu helfen, Ihre Anfrage schnell über Anthropic- und Azure-Systeme hinweg zu lokalisieren und zu untersuchen.

Unterstützte Funktionen

Claude auf Foundry unterstützt die meisten leistungsstarken Funktionen von Claude. Sie finden alle derzeit unterstützten Funktionen hier.

Nicht unterstützte Funktionen

  • Admin API (/v1/organizations/* Endpunkte)
  • Models API (/v1/models)
  • Message Batch API (/v1/messages/batches)

API-Antworten

API-Antworten von Claude auf Foundry folgen dem Standard-Anthropic API-Antwortformat. Dies umfasst das usage-Objekt in Antworttexten, das detaillierte Informationen zum Token-Verbrauch für Ihre Anfragen bereitstellt. Das usage-Objekt ist über alle Plattformen hinweg konsistent (First-Party-API, Foundry, Amazon Bedrock und Google Vertex AI). Weitere Informationen zu Antwortheadern, die für Foundry spezifisch sind, finden Sie im Abschnitt Korrelations-Request-IDs.

API-Modell-IDs und Bereitstellungen

Die folgenden Claude-Modelle sind über Foundry verfügbar. Die neuesten Generationsmodelle (Sonnet 4.5, Opus 4.1 und Haiku 4.5) bieten die fortschrittlichsten Funktionen:
ModellStandard-Bereitstellungsname
Claude Sonnet 4.5claude-sonnet-4-5
Claude Opus 4.1claude-opus-4-1
Claude Haiku 4.5claude-haiku-4-5
Standardmäßig entsprechen Bereitstellungsnamen den oben gezeigten Modell-IDs. Sie können jedoch benutzerdefinierte Bereitstellungen mit unterschiedlichen Namen im Foundry-Portal erstellen, um verschiedene Konfigurationen, Versionen oder Ratenlimits zu verwalten. Verwenden Sie den Bereitstellungsnamen (nicht unbedingt die Modell-ID) in Ihren API-Anfragen.

Überwachung und Protokollierung

Azure bietet umfassende Überwachungs- und Protokollierungsfunktionen für Ihre Claude-Nutzung über Standard-Azure-Muster:
  • Azure Monitor: Verfolgen Sie API-Nutzung, Latenz und Fehlerquoten
  • Azure Log Analytics: Abfragen und Analyse von Request/Response-Protokollen
  • Cost Management: Überwachen und prognostizieren Sie Kosten im Zusammenhang mit Claude-Nutzung
Anthropic empfiehlt, Ihre Aktivität mindestens auf einer 30-Tage-Rollbasis zu protokollieren, um Nutzungsmuster zu verstehen und potenzielle Probleme zu untersuchen.
Azure-Protokollierungsdienste werden in Ihrem Azure-Abonnement konfiguriert. Das Aktivieren der Protokollierung gibt Microsoft oder Anthropic keinen Zugriff auf Ihren Inhalt über das hinaus, was für Abrechnung und Dienstbetrieb erforderlich ist.

Fehlerbehebung

Authentifizierungsfehler

Fehler: 401 Unauthorized oder Invalid API key
  • Lösung: Überprüfen Sie, ob Ihr API-Schlüssel korrekt ist. Sie können einen neuen API-Schlüssel aus dem Azure-Portal unter Schlüssel und Endpunkt für Ihre Claude-Ressource abrufen.
  • Lösung: Wenn Sie Azure Entra ID verwenden, stellen Sie sicher, dass Ihr Zugriffstoken gültig ist und nicht abgelaufen ist. Token laufen normalerweise nach 1 Stunde ab.
Fehler: 403 Forbidden
  • Lösung: Ihr Azure-Konto verfügt möglicherweise nicht über die erforderlichen Berechtigungen. Stellen Sie sicher, dass Ihnen die entsprechende Azure RBAC-Rolle zugewiesen ist (z. B. „Cognitive Services OpenAI User”).

Ratenlimitierung

Fehler: 429 Too Many Requests
  • Lösung: Sie haben Ihr Ratenlimit überschritten. Implementieren Sie exponentielle Backoff- und Wiederholungslogik in Ihrer Anwendung.
  • Lösung: Erwägen Sie, Ratenlimiterhöhungen über das Azure-Portal oder den Azure-Support anzufordern.

Ratenlimit-Header

Foundry enthält nicht die Standard-Ratenlimit-Header von Anthropic (anthropic-ratelimit-tokens-limit, anthropic-ratelimit-tokens-remaining, anthropic-ratelimit-tokens-reset, anthropic-ratelimit-input-tokens-limit, anthropic-ratelimit-input-tokens-remaining, anthropic-ratelimit-input-tokens-reset, anthropic-ratelimit-output-tokens-limit, anthropic-ratelimit-output-tokens-remaining und anthropic-ratelimit-output-tokens-reset) in Antworten. Verwalten Sie die Ratenlimitierung stattdessen über Azures Überwachungstools.

Modell- und Bereitstellungsfehler

Fehler: Model not found oder Deployment not found
  • Lösung: Überprüfen Sie, ob Sie den korrekten Bereitstellungsnamen verwenden. Wenn Sie keine benutzerdefinierte Bereitstellung erstellt haben, verwenden Sie die Standard-Modell-ID (z. B. claude-sonnet-4-5).
  • Lösung: Stellen Sie sicher, dass das Modell/die Bereitstellung in Ihrer Azure-Region verfügbar ist.
Fehler: Invalid model parameter
  • Lösung: Der Modellparameter sollte Ihren Bereitstellungsnamen enthalten, der im Foundry-Portal angepasst werden kann. Überprüfen Sie, ob die Bereitstellung vorhanden ist und ordnungsgemäß konfiguriert ist.

Zusätzliche Ressourcen