Kosten effektiv verwalten

Claude Code verbraucht Token für jede Interaktion. Die durchschnittlichen Kosten betragen 6

pro Entwickler pro Tag, wobei die täglichen Kosten für 90% der Nutzer unter 12

bleiben. Für die Teamnutzung berechnet Claude Code nach API-Token-Verbrauch. Im Durchschnitt kostet Claude Code ~100-200 $/Entwickler pro Monat mit Sonnet 4.5, obwohl es große Abweichungen gibt, abhängig davon, wie viele Instanzen Benutzer ausführen und ob sie es in der Automatisierung verwenden.

Verfolgen Sie Ihre Kosten

Verwendung des `/cost`-Befehls

Der /cost-Befehl ist nicht für Claude Max- und Pro-Abonnenten vorgesehen.

Der /cost-Befehl bietet detaillierte Token-Verbrauchsstatistiken für Ihre aktuelle Sitzung:

Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

Zusätzliche Verfolgungsoptionen

Überprüfen Sie die historische Nutzung in der Claude Console (erfordert Admin- oder Billing-Rolle) und legen Sie Arbeitsbereich-Ausgabenlimits für den Claude Code-Arbeitsbereich fest (erfordert Admin-Rolle).

Wenn Sie Claude Code zum ersten Mal mit Ihrem Claude Console-Konto authentifizieren, wird automatisch ein Arbeitsbereich namens “Claude Code” für Sie erstellt. Dieser Arbeitsbereich bietet zentralisierte Kostenverfolgung und -verwaltung für die gesamte Claude Code-Nutzung in Ihrer Organisation. Sie können keine API-Schlüssel für diesen Arbeitsbereich erstellen - er ist ausschließlich für Claude Code-Authentifizierung und -Nutzung vorgesehen.

Kostenmanagement für Teams

Bei der Verwendung der Claude API können Sie die Gesamtausgaben des Claude Code-Arbeitsbereichs begrenzen. Zur Konfiguration folgen Sie diesen Anweisungen. Administratoren können Kosten- und Nutzungsberichte anzeigen, indem sie diesen Anweisungen folgen. Bei Bedrock und Vertex sendet Claude Code keine Metriken aus Ihrer Cloud. Um Kostenmetriken zu erhalten, berichteten mehrere große Unternehmen über die Verwendung von LiteLLM, einem Open-Source-Tool, das Unternehmen dabei hilft, Ausgaben nach Schlüssel zu verfolgen. Dieses Projekt ist nicht mit Anthropic verbunden und wir haben seine Sicherheit nicht geprüft.

Empfehlungen für Ratenlimits

Bei der Einrichtung von Claude Code für Teams sollten Sie diese Token Pro Minute (TPM) und Anfragen Pro Minute (RPM) pro Benutzer-Empfehlungen basierend auf Ihrer Organisationsgröße berücksichtigen:

Teamgröße	TPM pro Benutzer	RPM pro Benutzer
1-5 Benutzer	200k-300k	5-7
5-20 Benutzer	100k-150k	2.5-3.5
20-50 Benutzer	50k-75k	1.25-1.75
50-100 Benutzer	25k-35k	0.62-0.87
100-500 Benutzer	15k-20k	0.37-0.47
500+ Benutzer	10k-15k	0.25-0.35

Zum Beispiel, wenn Sie 200 Benutzer haben, könnten Sie 20k TPM für jeden Benutzer anfordern, oder 4 Millionen TPM insgesamt (200*20.000 = 4 Millionen). Die TPM pro Benutzer nimmt ab, wenn die Teamgröße wächst, da wir erwarten, dass weniger Benutzer Claude Code gleichzeitig in größeren Organisationen verwenden. Diese Ratenlimits gelten auf Organisationsebene, nicht pro einzelnem Benutzer, was bedeutet, dass einzelne Benutzer vorübergehend mehr als ihren berechneten Anteil verbrauchen können, wenn andere den Service nicht aktiv nutzen.

Wenn Sie Szenarien mit ungewöhnlich hoher gleichzeitiger Nutzung erwarten (wie Live-Schulungssitzungen mit großen Gruppen), benötigen Sie möglicherweise höhere TPM-Zuweisungen pro Benutzer.

Token-Verbrauch reduzieren

Kompakte Unterhaltungen:
- Claude verwendet standardmäßig Auto-Compact, wenn der Kontext 95% der Kapazität überschreitet
- Auto-Compact umschalten: Führen Sie /config aus und navigieren Sie zu “Auto-compact enabled”
- Verwenden Sie /compact manuell, wenn der Kontext groß wird
- Benutzerdefinierte Anweisungen hinzufügen: /compact Focus on code samples and API usage
- Kompaktierung anpassen, indem Sie zu CLAUDE.md hinzufügen:
  # Summary instructions When you are using compact, please focus on test output and code changes
Spezifische Abfragen schreiben: Vermeiden Sie vage Anfragen, die unnötiges Scannen auslösen
Komplexe Aufgaben aufteilen: Teilen Sie große Aufgaben in fokussierte Interaktionen auf
Verlauf zwischen Aufgaben löschen: Verwenden Sie /clear, um den Kontext zurückzusetzen

Die Kosten können erheblich variieren basierend auf:

Größe der analysierten Codebasis
Komplexität der Abfragen
Anzahl der durchsuchten oder modifizierten Dateien
Länge des Unterhaltungsverlaufs
Häufigkeit der Kompaktierung von Unterhaltungen

Hintergrund-Token-Verbrauch

Claude Code verwendet Token für einige Hintergrundfunktionen auch im Leerlauf:

Unterhaltungszusammenfassung: Hintergrund-Jobs, die vorherige Unterhaltungen für die claude --resume-Funktion zusammenfassen
Befehlsverarbeitung: Einige Befehle wie /cost können Anfragen generieren, um den Status zu überprüfen

Diese Hintergrundprozesse verbrauchen eine kleine Menge Token (typischerweise unter 0,04 $ pro Sitzung) auch ohne aktive Interaktion.

Verfolgung von Versionsänderungen und Updates

Aktuelle Versionsinformationen

Um Ihre aktuelle Claude Code-Version und Installationsdetails zu überprüfen:

claude doctor

Dieser Befehl zeigt Ihre Version, den Installationstyp und Systeminformationen.

Verstehen von Änderungen im Claude Code-Verhalten

Claude Code erhält regelmäßig Updates, die ändern können, wie Funktionen arbeiten, einschließlich Kostenberichterstattung:

Versionsverfolgung: Verwenden Sie claude doctor, um Ihre aktuelle Version zu sehen
Verhaltensänderungen: Funktionen wie /cost können Informationen in verschiedenen Versionen unterschiedlich anzeigen
Dokumentationszugang: Claude hat immer Zugang zur neuesten Dokumentation, die helfen kann, das aktuelle Funktionsverhalten zu erklären

Wenn sich die Kostenberichterstattung ändert

Wenn Sie Änderungen in der Art bemerken, wie Kosten angezeigt werden (wie der /cost-Befehl, der andere Informationen zeigt):

Überprüfen Sie Ihre Version: Führen Sie claude doctor aus, um Ihre aktuelle Version zu bestätigen
Dokumentation konsultieren: Fragen Sie Claude direkt nach dem aktuellen Funktionsverhalten, da es Zugang zu aktueller Dokumentation hat
Support kontaktieren: Für spezifische Abrechnungsfragen kontaktieren Sie den Anthropic-Support über Ihr Console-Konto

Für Team-Bereitstellungen empfehlen wir, mit einer kleinen Pilotgruppe zu beginnen, um Nutzungsmuster zu etablieren, bevor eine breitere Einführung erfolgt.

Erste Schritte

Mit Claude Code entwickeln

Claude Agent SDK

Bereitstellung

Verwaltung

Konfiguration

Referenz

Ressourcen

Kosten effektiv verwalten

Verfolgen Sie Ihre Kosten

Verwendung des `/cost`-Befehls

Zusätzliche Verfolgungsoptionen

Kostenmanagement für Teams

Empfehlungen für Ratenlimits

Token-Verbrauch reduzieren

Hintergrund-Token-Verbrauch

Verfolgung von Versionsänderungen und Updates

Aktuelle Versionsinformationen

Verstehen von Änderungen im Claude Code-Verhalten

Wenn sich die Kostenberichterstattung ändert

Erste Schritte

Mit Claude Code entwickeln

Claude Agent SDK

Bereitstellung

Verwaltung

Konfiguration

Referenz

Ressourcen

​Verfolgen Sie Ihre Kosten

​Verwendung des /cost-Befehls

​Zusätzliche Verfolgungsoptionen

​Kostenmanagement für Teams

​Empfehlungen für Ratenlimits

​Token-Verbrauch reduzieren

​Hintergrund-Token-Verbrauch

​Verfolgung von Versionsänderungen und Updates

​Aktuelle Versionsinformationen

​Verstehen von Änderungen im Claude Code-Verhalten

​Wenn sich die Kostenberichterstattung ändert

Verfolgen Sie Ihre Kosten

Verwendung des `/cost`-Befehls

Zusätzliche Verfolgungsoptionen

Kostenmanagement für Teams

Empfehlungen für Ratenlimits

Token-Verbrauch reduzieren

Hintergrund-Token-Verbrauch

Verfolgung von Versionsänderungen und Updates

Aktuelle Versionsinformationen

Verstehen von Änderungen im Claude Code-Verhalten

Wenn sich die Kostenberichterstattung ändert