Pengeditan konteks saat ini dalam beta dengan dukungan untuk pembersihan hasil alat dan pembersihan blok pemikiran. Untuk mengaktifkannya, gunakan header beta
context-management-2025-06-27 dalam permintaan API Anda.Silakan hubungi kami melalui formulir umpan balik kami untuk berbagi umpan balik Anda tentang fitur ini.Ikhtisar
Pengeditan konteks memungkinkan Anda mengelola konteks percakapan secara otomatis saat berkembang, membantu Anda mengoptimalkan biaya dan tetap berada dalam batas jendela konteks. API menyediakan strategi berbeda untuk mengelola konteks:- Pembersihan hasil alat (
clear_tool_uses_20250919): Secara otomatis menghapus pasangan penggunaan alat/hasil ketika konteks percakapan melebihi ambang batas yang dikonfigurasi - Pembersihan blok pemikiran (
clear_thinking_20251015): Mengelola blok pemikiran dengan menghapus blok pemikiran yang lebih lama dari putaran sebelumnya
Strategi pengeditan konteks
Pembersihan hasil alat
Strategiclear_tool_uses_20250919 menghapus hasil alat ketika konteks percakapan tumbuh melampaui ambang batas yang dikonfigurasi. Ketika diaktifkan, API secara otomatis menghapus hasil alat tertua dalam urutan kronologis, menggantinya dengan teks placeholder untuk memberi tahu Claude bahwa hasil alat telah dihapus. Secara default, hanya hasil alat yang dihapus. Anda dapat secara opsional menghapus hasil alat dan panggilan alat (parameter penggunaan alat) dengan mengatur clear_tool_inputs ke true.
Pembersihan blok pemikiran
Strategiclear_thinking_20251015 mengelola blok thinking dalam percakapan ketika pemikiran yang diperluas diaktifkan. Strategi ini secara otomatis menghapus blok pemikiran yang lebih lama dari putaran sebelumnya.
Perilaku default: Ketika pemikiran yang diperluas diaktifkan tanpa mengonfigurasi strategi
clear_thinking_20251015, API secara otomatis menyimpan hanya blok pemikiran dari putaran asisten terakhir (setara dengan keep: {type: "thinking_turns", value: 1}).Untuk memaksimalkan cache hits, pertahankan semua blok pemikiran dengan mengatur keep: "all".Putaran percakapan asisten mungkin mencakup beberapa blok konten (misalnya saat menggunakan alat) dan beberapa blok pemikiran (misalnya dengan pemikiran yang disisipi).
Pengeditan konteks terjadi di sisi serverPengeditan konteks diterapkan di sisi server sebelum prompt mencapai Claude. Aplikasi klien Anda mempertahankan riwayat percakapan lengkap yang tidak dimodifikasi—Anda tidak perlu menyinkronkan status klien Anda dengan versi yang diedit. Terus kelola riwayat percakapan lengkap Anda secara lokal seperti biasanya.
Pengeditan konteks dan caching promptInteraksi pengeditan konteks dengan caching prompt bervariasi menurut strategi:
-
Pembersihan hasil alat: Membatalkan prefiks prompt yang di-cache ketika konten dihapus. Untuk memperhitungkan ini, kami merekomendasikan menghapus cukup token untuk membuat pembatalan cache layak dilakukan. Gunakan parameter
clear_at_leastuntuk memastikan jumlah token minimum dihapus setiap kali. Anda akan dikenakan biaya penulisan cache setiap kali konten dihapus, tetapi permintaan berikutnya dapat menggunakan kembali prefiks yang baru di-cache. -
Pembersihan blok pemikiran: Ketika blok pemikiran dipertahankan dalam konteks (tidak dihapus), cache prompt dipertahankan, memungkinkan cache hits dan mengurangi biaya token input. Ketika blok pemikiran dihapus, cache dibatalkan pada titik di mana pembersihan terjadi. Konfigurasikan parameter
keepberdasarkan apakah Anda ingin memprioritaskan kinerja cache atau ketersediaan jendela konteks.
Model yang didukung
Pengeditan konteks tersedia di:- Claude Opus 4.1 (
claude-opus-4-1-20250805) - Claude Opus 4 (
claude-opus-4-20250514) - Claude Sonnet 4.5 (
claude-sonnet-4-5-20250929) - Claude Sonnet 4 (
claude-sonnet-4-20250514) - Claude Haiku 4.5 (
claude-haiku-4-5-20251001)
Penggunaan pembersihan hasil alat
Cara paling sederhana untuk mengaktifkan pembersihan hasil alat adalah dengan menentukan hanya jenis strategi, karena semua opsi konfigurasi lainnya akan menggunakan nilai default mereka:Konfigurasi lanjutan
Anda dapat menyesuaikan perilaku pembersihan hasil alat dengan parameter tambahan:Penggunaan pembersihan blok pemikiran
Aktifkan pembersihan blok pemikiran untuk mengelola konteks dan caching prompt secara efektif ketika pemikiran yang diperluas diaktifkan:Opsi konfigurasi untuk pembersihan blok pemikiran
Strategiclear_thinking_20251015 mendukung konfigurasi berikut:
| Opsi konfigurasi | Default | Deskripsi |
|---|---|---|
keep | {type: "thinking_turns", value: 1} | Menentukan berapa banyak putaran asisten terbaru dengan blok pemikiran yang akan dipertahankan. Gunakan {type: "thinking_turns", value: N} di mana N harus > 0 untuk menyimpan N putaran terakhir, atau "all" untuk menyimpan semua blok pemikiran. |
Menggabungkan strategi
Anda dapat menggunakan pembersihan blok pemikiran dan pembersihan hasil alat bersama-sama:Ketika menggunakan beberapa strategi, strategi
clear_thinking_20251015 harus terdaftar terlebih dahulu dalam array edits.Opsi konfigurasi untuk pembersihan hasil alat
| Opsi konfigurasi | Default | Deskripsi |
|---|---|---|
trigger | 100.000 token input | Menentukan kapan strategi pengeditan konteks diaktifkan. Setelah prompt melebihi ambang batas ini, pembersihan akan dimulai. Anda dapat menentukan nilai ini dalam input_tokens atau tool_uses. |
keep | 3 penggunaan alat | Menentukan berapa banyak pasangan penggunaan alat/hasil terbaru yang akan dipertahankan setelah pembersihan terjadi. API menghapus interaksi alat tertua terlebih dahulu, mempertahankan yang paling baru. |
clear_at_least | Tidak ada | Memastikan jumlah token minimum dihapus setiap kali strategi diaktifkan. Jika API tidak dapat menghapus setidaknya jumlah yang ditentukan, strategi tidak akan diterapkan. Ini membantu menentukan apakah pembersihan konteks layak untuk memecahkan cache prompt Anda. |
exclude_tools | Tidak ada | Daftar nama alat yang penggunaan dan hasil alatnya tidak boleh pernah dihapus. Berguna untuk mempertahankan konteks penting. |
clear_tool_inputs | false | Mengontrol apakah parameter panggilan alat dihapus bersama dengan hasil alat. Secara default, hanya hasil alat yang dihapus sambil menjaga panggilan alat asli Claude tetap terlihat. |
Respons pengeditan konteks
Anda dapat melihat pengeditan konteks mana yang diterapkan pada permintaan Anda menggunakan bidang responscontext_management, bersama dengan statistik yang membantu tentang konten dan token input yang dihapus.
Response
message_delta terakhir:
Streaming Response
Penghitungan token
Titik akhir penghitungan token mendukung manajemen konteks, memungkinkan Anda melihat pratinjau berapa banyak token yang akan digunakan prompt Anda setelah pengeditan konteks diterapkan.Response
input_tokens) dan jumlah token asli sebelum pembersihan apa pun terjadi (original_input_tokens).
Menggunakan dengan Alat Memori
Pengeditan konteks dapat digabungkan dengan alat memori. Ketika konteks percakapan Anda mendekati ambang batas pembersihan yang dikonfigurasi, Claude menerima peringatan otomatis untuk mempertahankan informasi penting. Ini memungkinkan Claude untuk menyimpan hasil alat atau konteks ke file memori sebelum dihapus dari riwayat percakapan. Kombinasi ini memungkinkan Anda untuk:- Pertahankan konteks penting: Claude dapat menulis informasi penting dari hasil alat ke file memori sebelum hasil tersebut dihapus
- Pertahankan alur kerja yang berjalan lama: Aktifkan alur kerja agentic yang sebaliknya akan melampaui batas konteks dengan memindahkan informasi ke penyimpanan persisten
- Akses informasi sesuai permintaan: Claude dapat mencari informasi yang sebelumnya dihapus dari file memori saat diperlukan, daripada menyimpan semuanya di jendela konteks aktif