Kosten effektiv verwalten
Erfahren Sie, wie Sie Token-Verbrauch und Kosten beim Verwenden von Claude Code verfolgen und optimieren können.
Claude Code verbraucht Token für jede Interaktion. Die durchschnittlichen Kosten betragen 6 bleiben.
Für die Teamnutzung berechnet Claude Code nach API-Token-Verbrauch. Im Durchschnitt kostet Claude Code ~100-200 $/Entwickler pro Monat mit Sonnet 4, obwohl es große Abweichungen gibt, je nachdem, wie viele Instanzen Benutzer ausführen und ob sie es in der Automatisierung verwenden.
Verfolgen Sie Ihre Kosten
Verwendung des /cost
-Befehls
Der /cost
-Befehl ist nicht für Claude Max- und Pro-Abonnenten vorgesehen.
Der /cost
-Befehl bietet detaillierte Token-Verbrauchsstatistiken für Ihre aktuelle Sitzung:
Zusätzliche Verfolgungsoptionen
Überprüfen Sie die historische Nutzung in der Anthropic Console (erfordert Admin- oder Billing-Rolle) und setzen Sie Workspace-Ausgabenlimits für den Claude Code-Workspace (erfordert Admin-Rolle).
Wenn Sie Claude Code zum ersten Mal mit Ihrem Anthropic Console-Konto authentifizieren, wird automatisch ein Workspace namens “Claude Code” für Sie erstellt. Dieser Workspace bietet zentralisierte Kostenverfolgung und -verwaltung für die gesamte Claude Code-Nutzung in Ihrer Organisation.
Kostenverwaltung für Teams
Bei der Verwendung der Anthropic API können Sie die Gesamtausgaben für den Claude Code-Workspace begrenzen. Zur Konfiguration folgen Sie diesen Anweisungen. Administratoren können Kosten- und Nutzungsberichte einsehen, indem sie diesen Anweisungen folgen.
Bei Bedrock und Vertex sendet Claude Code keine Metriken aus Ihrer Cloud. Um Kostenmetriken zu erhalten, berichteten mehrere große Unternehmen über die Verwendung von LiteLLM, einem Open-Source-Tool, das Unternehmen dabei hilft, Ausgaben nach Schlüssel zu verfolgen. Dieses Projekt ist nicht mit Anthropic verbunden und wir haben seine Sicherheit nicht geprüft.
Empfehlungen für Ratenlimits
Bei der Einrichtung von Claude Code für Teams sollten Sie diese Token Pro Minute (TPM) und Anfragen Pro Minute (RPM) pro Benutzer-Empfehlungen basierend auf Ihrer Organisationsgröße berücksichtigen:
Teamgröße | TPM pro Benutzer | RPM pro Benutzer |
---|---|---|
1-5 Benutzer | 200k-300k | 5-7 |
5-20 Benutzer | 100k-150k | 2.5-3.5 |
20-50 Benutzer | 50k-75k | 1.25-1.75 |
50-100 Benutzer | 25k-35k | 0.62-0.87 |
100-500 Benutzer | 15k-20k | 0.37-0.47 |
500+ Benutzer | 10k-15k | 0.25-0.35 |
Wenn Sie beispielsweise 200 Benutzer haben, könnten Sie 20k TPM für jeden Benutzer anfordern, oder 4 Millionen TPM insgesamt (200*20.000 = 4 Millionen).
Die TPM pro Benutzer nimmt ab, wenn die Teamgröße wächst, da wir erwarten, dass weniger Benutzer Claude Code gleichzeitig in größeren Organisationen verwenden. Diese Ratenlimits gelten auf Organisationsebene, nicht pro einzelnem Benutzer, was bedeutet, dass einzelne Benutzer vorübergehend mehr als ihren berechneten Anteil verbrauchen können, wenn andere den Service nicht aktiv nutzen.
Wenn Sie Szenarien mit ungewöhnlich hoher gleichzeitiger Nutzung erwarten (wie Live-Schulungssitzungen mit großen Gruppen), benötigen Sie möglicherweise höhere TPM-Zuweisungen pro Benutzer.
Token-Verbrauch reduzieren
-
Kompakte Unterhaltungen:
-
Claude verwendet standardmäßig Auto-Compact, wenn der Kontext 95% der Kapazität überschreitet
-
Auto-Compact umschalten: Führen Sie
/config
aus und navigieren Sie zu “Auto-compact enabled” -
Verwenden Sie
/compact
manuell, wenn der Kontext groß wird -
Benutzerdefinierte Anweisungen hinzufügen:
/compact Focus on code samples and API usage
-
Kompaktierung anpassen, indem Sie zu CLAUDE.md hinzufügen:
-
-
Spezifische Abfragen schreiben: Vermeiden Sie vage Anfragen, die unnötiges Scannen auslösen
-
Komplexe Aufgaben aufteilen: Teilen Sie große Aufgaben in fokussierte Interaktionen auf
-
Verlauf zwischen Aufgaben löschen: Verwenden Sie
/clear
, um den Kontext zurückzusetzen
Die Kosten können erheblich variieren basierend auf:
- Größe der analysierten Codebasis
- Komplexität der Abfragen
- Anzahl der durchsuchten oder geänderten Dateien
- Länge des Unterhaltungsverlaufs
- Häufigkeit der Kompaktierung von Unterhaltungen
- Hintergrundprozesse (Haiku-Generierung, Unterhaltungszusammenfassung)
Hintergrund-Token-Verbrauch
Claude Code verwendet Token für einige Hintergrundfunktionalitäten auch im Leerlauf:
- Haiku-Generierung: Kleine kreative Nachrichten, die beim Tippen erscheinen (etwa 1 Cent pro Tag)
- Unterhaltungszusammenfassung: Hintergrundjobs, die vorherige Unterhaltungen für die
claude --resume
-Funktion zusammenfassen - Befehlsverarbeitung: Einige Befehle wie
/cost
können Anfragen generieren, um den Status zu überprüfen
Diese Hintergrundprozesse verbrauchen eine kleine Menge Token (typischerweise unter 0,04 $ pro Sitzung) auch ohne aktive Interaktion.
Verfolgung von Versionsänderungen und Updates
Aktuelle Versionsinformationen
Um Ihre aktuelle Claude Code-Version und Installationsdetails zu überprüfen:
Dieser Befehl zeigt Ihre Version, Installationstyp und Systeminformationen.
Verstehen von Änderungen im Claude Code-Verhalten
Claude Code erhält regelmäßig Updates, die ändern können, wie Funktionen arbeiten, einschließlich Kostenberichterstattung:
- Versionsverfolgung: Verwenden Sie
claude doctor
, um Ihre aktuelle Version zu sehen - Verhaltensänderungen: Funktionen wie
/cost
können Informationen in verschiedenen Versionen unterschiedlich anzeigen - Dokumentationszugriff: Claude hat immer Zugriff auf die neueste Dokumentation, die helfen kann, aktuelles Funktionsverhalten zu erklären
Wenn sich die Kostenberichterstattung ändert
Wenn Sie Änderungen in der Anzeige von Kosten bemerken (wie der /cost
-Befehl, der andere Informationen zeigt):
- Überprüfen Sie Ihre Version: Führen Sie
claude doctor
aus, um Ihre aktuelle Version zu bestätigen - Dokumentation konsultieren: Fragen Sie Claude direkt nach aktuellem Funktionsverhalten, da es Zugriff auf aktuelle Dokumentation hat
- Support kontaktieren: Für spezifische Abrechnungsfragen kontaktieren Sie den Anthropic-Support über Ihr Console-Konto
Für Team-Bereitstellungen empfehlen wir, mit einer kleinen Pilotgruppe zu beginnen, um Nutzungsmuster zu etablieren, bevor eine breitere Einführung erfolgt.