- Claude Opus 4.1 (
claude-opus-4-1-20250805) - Claude Opus 4 (
claude-opus-4-20250514) - Claude Sonnet 4.5 (
claude-sonnet-4-5-20250929) - Claude Sonnet 4 (
claude-sonnet-4-20250514) - Claude Sonnet 3.7 (deprecated) (
claude-3-7-sonnet-20250219) - Claude 3.5 Haiku (
claude-3-5-haiku-20241022)
Manfaat utama
- Kutipan alami - Capai kualitas kutipan yang sama seperti pencarian web untuk konten apa pun
- Integrasi fleksibel - Gunakan dalam pengembalian alat untuk RAG dinamis atau sebagai konten tingkat atas untuk data yang sudah diambil
- Atribusi sumber yang tepat - Setiap hasil mencakup informasi sumber dan judul untuk atribusi yang jelas
- Tidak perlu solusi berbasis dokumen - Menghilangkan kebutuhan akan solusi berbasis dokumen
- Format kutipan yang konsisten - Cocok dengan kualitas dan format kutipan dari fungsi pencarian web Claude
Cara kerjanya
Hasil pencarian dapat disediakan dengan dua cara:- Dari panggilan alat - Alat kustom Anda mengembalikan hasil pencarian, memungkinkan aplikasi RAG dinamis
- Sebagai konten tingkat atas - Anda menyediakan hasil pencarian langsung dalam pesan pengguna untuk konten yang sudah diambil atau di-cache
Skema hasil pencarian
Hasil pencarian menggunakan struktur berikut:Bidang yang diperlukan
| Bidang | Tipe | Deskripsi |
|---|---|---|
type | string | Harus "search_result" |
source | string | URL sumber atau pengenal untuk konten |
title | string | Judul deskriptif untuk hasil pencarian |
content | array | Array blok teks yang berisi konten aktual |
Bidang opsional
| Bidang | Tipe | Deskripsi |
|---|---|---|
citations | object | Konfigurasi kutipan dengan bidang boolean enabled |
cache_control | object | Pengaturan kontrol cache (misalnya, {"type": "ephemeral"}) |
content harus berupa blok teks dengan:
type: Harus"text"text: Konten teks aktual (string tidak kosong)
Metode 1: Hasil pencarian dari panggilan alat
Kasus penggunaan paling kuat adalah mengembalikan hasil pencarian dari alat kustom Anda. Ini memungkinkan aplikasi RAG dinamis di mana alat mengambil dan mengembalikan konten yang relevan dengan kutipan otomatis.Contoh: Alat basis pengetahuan
Metode 2: Hasil pencarian sebagai konten tingkat atas
Anda juga dapat menyediakan hasil pencarian langsung dalam pesan pengguna. Ini berguna untuk:- Konten yang sudah diambil dari infrastruktur pencarian Anda
- Hasil pencarian yang di-cache dari kueri sebelumnya
- Konten dari layanan pencarian eksternal
- Pengujian dan pengembangan
Contoh: Hasil pencarian langsung
Respons Claude dengan kutipan
Terlepas dari bagaimana hasil pencarian disediakan, Claude secara otomatis menyertakan kutipan saat menggunakan informasi dari mereka:Bidang kutipan
Setiap kutipan mencakup:| Bidang | Tipe | Deskripsi |
|---|---|---|
type | string | Selalu "search_result_location" untuk kutipan hasil pencarian |
source | string | Sumber dari hasil pencarian asli |
title | string atau null | Judul dari hasil pencarian asli |
cited_text | string | Teks yang tepat sedang dikutip |
search_result_index | integer | Indeks hasil pencarian (berbasis 0) |
start_block_index | integer | Posisi awal dalam array konten |
end_block_index | integer | Posisi akhir dalam array konten |
search_result_index mengacu pada indeks blok konten hasil pencarian (berbasis 0), terlepas dari bagaimana hasil pencarian disediakan (panggilan alat atau konten tingkat atas).
Blok konten berganda
Hasil pencarian dapat berisi beberapa blok teks dalam arraycontent:
start_block_index dan end_block_index.
Penggunaan lanjutan
Menggabungkan kedua metode
Anda dapat menggunakan hasil pencarian berbasis alat dan tingkat atas dalam percakapan yang sama:Menggabungkan dengan tipe konten lain
Kedua metode mendukung pencampuran hasil pencarian dengan konten lain:Kontrol cache
Tambahkan kontrol cache untuk kinerja yang lebih baik:Kontrol kutipan
Secara default, kutipan dinonaktifkan untuk hasil pencarian. Anda dapat mengaktifkan kutipan dengan secara eksplisit menetapkan konfigurasicitations:
citations.enabled diatur ke true, Claude akan menyertakan referensi kutipan saat menggunakan informasi dari hasil pencarian. Ini memungkinkan:
- Kutipan alami untuk aplikasi RAG kustom Anda
- Atribusi sumber saat berinteraksi dengan basis pengetahuan proprietary
- Kutipan berkualitas pencarian web untuk alat kustom apa pun yang mengembalikan hasil pencarian
citations dihilangkan, kutipan dinonaktifkan secara default.
Kutipan adalah semua-atau-tidak-sama-sekali: baik semua hasil pencarian dalam permintaan harus memiliki kutipan diaktifkan, atau semua harus dinonaktifkan. Pencampuran hasil pencarian dengan pengaturan kutipan yang berbeda akan menghasilkan kesalahan. Jika Anda perlu menonaktifkan kutipan untuk beberapa sumber, Anda harus menonaktifkannya untuk semua hasil pencarian dalam permintaan tersebut.
Praktik terbaik
Untuk pencarian berbasis alat (Metode 1)
- Konten dinamis: Gunakan untuk pencarian real-time dan aplikasi RAG dinamis
- Penanganan kesalahan: Kembalikan pesan yang sesuai ketika pencarian gagal
- Batas hasil: Kembalikan hanya hasil yang paling relevan untuk menghindari overflow konteks
Untuk pencarian tingkat atas (Metode 2)
- Konten yang sudah diambil: Gunakan ketika Anda sudah memiliki hasil pencarian
- Pemrosesan batch: Ideal untuk memproses beberapa hasil pencarian sekaligus
- Pengujian: Bagus untuk menguji perilaku kutipan dengan konten yang diketahui
Praktik terbaik umum
-
Struktur hasil secara efektif
- Gunakan URL sumber yang jelas dan permanen
- Berikan judul deskriptif
- Pisahkan konten panjang menjadi blok teks logis
-
Pertahankan konsistensi
- Gunakan format sumber yang konsisten di seluruh aplikasi Anda
- Pastikan judul secara akurat mencerminkan konten
- Pertahankan pemformatan yang konsisten
-
Tangani kesalahan dengan baik
Keterbatasan
- Blok konten hasil pencarian tersedia di Claude API dan Vertex AI Google Cloud
- Hanya konten teks yang didukung dalam hasil pencarian (tidak ada gambar atau media lainnya)
- Array
contentharus berisi setidaknya satu blok teks