跟踪您的成本
使用 /cost 命令
/cost 命令不适用于 Claude Max 和 Pro 订阅用户。/cost 命令为您的当前会话提供详细的令牌使用统计信息:
其他跟踪选项
在 Claude Console 中检查历史使用情况(需要管理员或计费角色)并为 Claude Code 工作区设置工作区支出限制(需要管理员角色)。当您首次使用 Claude Console 账户验证 Claude Code 时,会自动为您创建一个名为”Claude Code”的工作区。此工作区为您组织中的所有 Claude Code 使用提供集中的成本跟踪和管理。您无法为此工作区创建 API 密钥 - 它专门用于 Claude Code 身份验证和使用。
为团队管理成本
使用 Claude API 时,您可以限制 Claude Code 工作区的总支出。要配置,请按照这些说明操作。管理员可以通过按照这些说明操作查看成本和使用情况报告。 在 Bedrock 和 Vertex 上,Claude Code 不会从您的云端发送指标。为了获取成本指标,几家大型企业报告使用了 LiteLLM,这是一个开源工具,帮助公司按密钥跟踪支出。此项目与 Anthropic 无关,我们未审核其安全性。速率限制建议
为团队设置 Claude Code 时,请根据您的组织规模考虑以下每用户每分钟令牌数 (TPM) 和每分钟请求数 (RPM) 建议:| 团队规模 | 每用户 TPM | 每用户 RPM |
|---|---|---|
| 1-5 用户 | 200k-300k | 5-7 |
| 5-20 用户 | 100k-150k | 2.5-3.5 |
| 20-50 用户 | 50k-75k | 1.25-1.75 |
| 50-100 用户 | 25k-35k | 0.62-0.87 |
| 100-500 用户 | 15k-20k | 0.37-0.47 |
| 500+ 用户 | 10k-15k | 0.25-0.35 |
如果您预期会出现异常高并发使用的场景(例如大型团体的现场培训会话),您可能需要为每个用户分配更高的 TPM。
减少令牌使用量
-
紧凑对话:
- Claude 默认在上下文超过 95% 容量时使用自动紧凑
-
切换自动紧凑:运行
/config并导航到”Auto-compact enabled” -
当上下文变大时手动使用
/compact -
添加自定义指令:
/compact Focus on code samples and API usage -
通过添加到 CLAUDE.md 来自定义紧凑:
- 编写具体查询: 避免触发不必要扫描的模糊请求
- 分解复杂任务: 将大型任务拆分为专注的交互
-
在任务之间清除历史: 使用
/clear重置上下文
- 被分析代码库的大小
- 查询的复杂性
- 被搜索或修改的文件数量
- 对话历史的长度
- 紧凑对话的频率
后台令牌使用
Claude Code 即使在空闲时也会为某些后台功能使用令牌:- 对话摘要:为
claude --resume功能总结先前对话的后台作业 - 命令处理:某些命令如
/cost可能生成请求以检查状态
跟踪版本更改和更新
当前版本信息
要检查您当前的 Claude Code 版本和安装详细信息:了解 Claude Code 行为的变化
Claude Code 定期接收可能改变功能工作方式的更新,包括成本报告:- 版本跟踪:使用
claude doctor查看您的当前版本 - 行为变化:像
/cost这样的功能可能在不同版本中显示不同的信息 - 文档访问:Claude 始终可以访问最新文档,这可以帮助解释当前功能行为
当成本报告发生变化时
如果您注意到成本显示方式的变化(例如/cost 命令显示不同信息):
- 验证您的版本:运行
claude doctor确认您的当前版本 - 查阅文档:直接询问 Claude 当前功能行为,因为它可以访问最新文档
- 联系支持:对于具体的计费问题,请通过您的 Console 账户联系 Anthropic 支持
对于团队部署,我们建议从小型试点组开始建立使用模式,然后再进行更广泛的推广。