Hosting Agent SDK
Claude Agent SDK berbeda dari API LLM stateless tradisional karena mempertahankan state percakapan dan mengeksekusi perintah dalam lingkungan yang persisten. Panduan ini mencakup arsitektur, pertimbangan hosting, dan praktik terbaik untuk mendeploy agen berbasis SDK dalam produksi.Memahami Arsitektur SDK
Model Proses Long-Running
Tidak seperti panggilan API stateless, Claude Agent SDK beroperasi sebagai proses long-running yang:- Mengeksekusi perintah dalam lingkungan shell yang persisten
- Mengelola operasi file dalam direktori kerja
- Menangani eksekusi tool dengan konteks dari interaksi sebelumnya
Persyaratan Hosting
Sandboxing Berbasis Container
Untuk keamanan dan isolasi, SDK harus berjalan di dalam lingkungan container yang di-sandbox. Ini menyediakan:- Isolasi proses - Lingkungan eksekusi terpisah per sesi
- Batas resource - Batasan CPU, memori, dan penyimpanan
- Kontrol jaringan - Membatasi koneksi keluar
- Filesystem ephemeral - State bersih untuk setiap sesi
Persyaratan Sistem
Setiap instance SDK memerlukan:-
Dependensi runtime
- Python 3.10+ (untuk Python SDK) atau Node.js 18+ (untuk TypeScript SDK)
- Node.js (diperlukan oleh Claude Code CLI)
- Claude Code CLI:
npm install -g @anthropic-ai/claude-code
-
Alokasi resource
- Direkomendasikan: 1GiB RAM, 5GiB disk, dan 1 CPU (sesuaikan berdasarkan tugas Anda sesuai kebutuhan)
-
Akses jaringan
- HTTPS keluar ke
api.anthropic.com
- Opsional: Akses ke server MCP atau tool eksternal
- HTTPS keluar ke
Opsi Penyedia Sandbox
Beberapa penyedia mengkhususkan diri dalam lingkungan container yang aman untuk eksekusi kode AI:Pola Deployment Produksi
Pola 1: Sesi Ephemeral
Buat container baru untuk setiap tugas pengguna, kemudian hancurkan ketika selesai. Terbaik untuk tugas sekali pakai, pengguna masih dapat berinteraksi dengan AI saat tugas sedang diselesaikan, tetapi setelah selesai container dihancurkan. Contoh:- Investigasi & Perbaikan Bug: Debug dan menyelesaikan masalah spesifik dengan konteks yang relevan
- Pemrosesan Invoice: Ekstrak dan strukturkan data dari kwitansi/invoice untuk sistem akuntansi
- Tugas Terjemahan: Menerjemahkan dokumen atau batch konten antar bahasa
- Pemrosesan Gambar/Video: Menerapkan transformasi, optimisasi, atau mengekstrak metadata dari file media
Pola 2: Sesi Long-Running
Mempertahankan instance container yang persisten untuk tugas long running. Seringkali menjalankan multiple proses Claude Agent di dalam container berdasarkan permintaan. Terbaik untuk agen proaktif yang mengambil tindakan tanpa input pengguna, agen yang menyajikan konten atau agen yang memproses jumlah pesan yang tinggi. Contoh:- Email Agent: Memantau email masuk dan secara otonom melakukan triase, merespons, atau mengambil tindakan berdasarkan konten
- Site Builder: Meng-host website kustom per pengguna dengan kemampuan editing langsung yang disajikan melalui port container
- High-Frequency Chat Bots: Menangani aliran pesan berkelanjutan dari platform seperti Slack di mana waktu respons yang cepat sangat penting
Pola 3: Sesi Hybrid
Container ephemeral yang dihidrasi dengan riwayat dan state, mungkin dari database atau dari fitur session resumption SDK. Terbaik untuk container dengan interaksi intermiten dari pengguna yang memulai pekerjaan dan mati ketika pekerjaan selesai tetapi dapat dilanjutkan. Contoh:- Personal Project Manager: Membantu mengelola proyek yang sedang berlangsung dengan check-in intermiten, mempertahankan konteks tugas, keputusan, dan kemajuan
- Deep Research: Melakukan tugas penelitian multi-jam, menyimpan temuan dan melanjutkan investigasi ketika pengguna kembali
- Customer Support Agent: Menangani tiket dukungan yang mencakup multiple interaksi, memuat riwayat tiket dan konteks pelanggan
Pola 4: Single Container
Menjalankan multiple proses Claude Agent SDK dalam satu container global. Terbaik untuk agen yang harus berkolaborasi erat bersama. Ini kemungkinan pola yang paling tidak populer karena Anda harus mencegah agen saling menimpa. Contoh:- Simulasi: Agen yang berinteraksi satu sama lain dalam simulasi seperti video game.
FAQ
Bagaimana cara berkomunikasi dengan sandbox saya?
Ketika hosting dalam container, expose port untuk berkomunikasi dengan instance SDK Anda. Aplikasi Anda dapat mengekspos endpoint HTTP/WebSocket untuk klien eksternal sementara SDK berjalan secara internal di dalam container.Berapa biaya hosting container?
Kami menemukan bahwa biaya dominan untuk melayani agen adalah token, container bervariasi berdasarkan apa yang Anda provisikan tetapi biaya minimum sekitar 5 sen per jam berjalan.Kapan saya harus mematikan container idle vs. menjaganya tetap hangat?
Ini kemungkinan bergantung pada penyedia, penyedia sandbox yang berbeda akan memungkinkan Anda menetapkan kriteria yang berbeda untuk timeout idle setelah itu sandbox mungkin mati. Anda akan ingin menyetel timeout ini berdasarkan seberapa sering Anda pikir respons pengguna mungkin terjadi.Seberapa sering saya harus memperbarui Claude Code CLI?
Claude Code CLI diberi versi dengan semver, jadi setiap perubahan breaking akan diberi versi.Bagaimana cara memantau kesehatan container dan performa agen?
Karena container hanyalah server, infrastruktur logging yang sama yang Anda gunakan untuk backend akan bekerja untuk container.Berapa lama sesi agen dapat berjalan sebelum timeout?
Sesi agen tidak akan timeout, tetapi kami merekomendasikan menetapkan properti ‘maxTurns’ untuk mencegah Claude terjebak dalam loop.Langkah Selanjutnya
- Panduan Sessions - Pelajari tentang manajemen sesi
- Permissions - Konfigurasi izin tool
- Cost Tracking - Pantau penggunaan API
- MCP Integration - Perluas dengan tool kustom