Sebelum memulai
Panduan ini mengasumsikan bahwa Anda telah memutuskan untuk menggunakan mode pemikiran diperpanjang dan telah meninjau langkah-langkah dasar kami tentang cara memulai dengan pemikiran diperpanjang serta panduan implementasi pemikiran diperpanjang kami.Pertimbangan teknis untuk pemikiran diperpanjang
- Token pemikiran memiliki anggaran minimum 1024 token. Kami merekomendasikan Anda memulai dengan anggaran pemikiran minimum dan meningkatkan secara bertahap untuk menyesuaikan berdasarkan kebutuhan dan kompleksitas tugas Anda.
- Untuk beban kerja di mana anggaran pemikiran optimal di atas 32K, kami merekomendasikan Anda menggunakan pemrosesan batch untuk menghindari masalah jaringan. Permintaan yang mendorong model untuk berpikir di atas 32K token menyebabkan permintaan yang berjalan lama yang mungkin mengalami timeout sistem dan batas koneksi terbuka.
- Pemikiran diperpanjang berkinerja terbaik dalam bahasa Inggris, meskipun output akhir dapat dalam bahasa apa pun yang didukung Claude.
- Jika Anda memerlukan pemikiran di bawah anggaran minimum, kami merekomendasikan menggunakan mode standar, dengan pemikiran dimatikan, dengan prompting chain-of-thought tradisional dengan tag XML (seperti
<thinking>). Lihat prompting chain of thought.
Teknik prompting untuk pemikiran diperpanjang
Gunakan instruksi umum terlebih dahulu, kemudian troubleshoot dengan instruksi langkah demi langkah yang lebih detail
Claude sering berkinerja lebih baik dengan instruksi tingkat tinggi untuk hanya berpikir mendalam tentang suatu tugas daripada panduan preskriptif langkah demi langkah. Kreativitas model dalam mendekati masalah mungkin melebihi kemampuan manusia untuk meresepkan proses pemikiran yang optimal. Misalnya, alih-alih:Multishot prompting dengan pemikiran diperpanjang
Multishot prompting bekerja dengan baik dengan pemikiran diperpanjang. Ketika Anda memberikan Claude contoh cara berpikir melalui masalah, ia akan mengikuti pola penalaran serupa dalam blok pemikiran diperpanjangnya. Anda dapat menyertakan contoh few-shot dalam prompt Anda dalam skenario pemikiran diperpanjang dengan menggunakan tag XML seperti<thinking> atau <scratchpad> untuk menunjukkan pola kanonik pemikiran diperpanjang dalam contoh tersebut.
Claude akan menggeneralisasi pola ke proses pemikiran diperpanjang formal. Namun, mungkin Anda akan mendapatkan hasil yang lebih baik dengan memberikan Claude kebebasan untuk berpikir dengan cara yang dianggapnya terbaik.
Contoh:
Memaksimalkan mengikuti instruksi dengan pemikiran diperpanjang
Claude menunjukkan peningkatan signifikan dalam mengikuti instruksi ketika pemikiran diperpanjang diaktifkan. Model biasanya:- Bernalar tentang instruksi di dalam blok pemikiran diperpanjang
- Mengeksekusi instruksi tersebut dalam respons
- Jelas dan spesifik tentang apa yang Anda inginkan
- Untuk instruksi kompleks, pertimbangkan untuk memecahnya menjadi langkah-langkah bernomor yang harus dikerjakan Claude secara metodis
- Berikan Claude anggaran yang cukup untuk memproses instruksi sepenuhnya dalam pemikiran diperpanjangnya
Menggunakan pemikiran diperpanjang untuk debug dan mengarahkan perilaku Claude
Anda dapat menggunakan output pemikiran Claude untuk debug logika Claude, meskipun metode ini tidak selalu dapat diandalkan dengan sempurna. Untuk memanfaatkan metodologi ini dengan sebaik-baiknya, kami merekomendasikan tips berikut:- Kami tidak merekomendasikan mengirimkan kembali pemikiran diperpanjang Claude dalam blok teks pengguna, karena ini tidak meningkatkan kinerja dan mungkin benar-benar menurunkan hasil.
- Prefilling pemikiran diperpanjang secara eksplisit tidak diizinkan, dan mengubah teks output model secara manual yang mengikuti blok pemikirannya kemungkinan akan menurunkan hasil karena kebingungan model.
assistant standar masih diizinkan.
Terkadang Claude mungkin mengulangi pemikiran diperpanjangnya dalam teks output assistant. Jika Anda menginginkan respons yang bersih, instruksikan Claude untuk tidak mengulangi pemikiran diperpanjangnya dan hanya mengeluarkan jawaban.
Memanfaatkan output panjang dan pemikiran bentuk panjang dengan sebaik-baiknya
Untuk kasus penggunaan generasi dataset, coba prompt seperti “Tolong buat tabel yang sangat detail tentang…” untuk menghasilkan dataset yang komprehensif. Untuk kasus penggunaan seperti generasi konten detail di mana Anda mungkin ingin menghasilkan blok pemikiran diperpanjang yang lebih panjang dan respons yang lebih detail, coba tips ini:- Tingkatkan panjang pemikiran diperpanjang maksimum DAN secara eksplisit minta output yang lebih panjang
- Untuk output yang sangat panjang (20.000+ kata), minta outline detail dengan jumlah kata hingga tingkat paragraf. Kemudian minta Claude untuk mengindeks paragrafnya ke outline dan mempertahankan jumlah kata yang ditentukan
Kami tidak merekomendasikan Anda mendorong Claude untuk mengeluarkan lebih banyak token demi mengeluarkan token. Sebaliknya, kami mendorong Anda untuk memulai dengan anggaran pemikiran kecil dan meningkatkan sesuai kebutuhan untuk menemukan pengaturan optimal untuk kasus penggunaan Anda.
Masalah STEM kompleks
Masalah STEM kompleks
Masalah STEM kompleks memerlukan Claude untuk membangun model mental, menerapkan pengetahuan khusus, dan bekerja melalui langkah-langkah logis berurutan—proses yang mendapat manfaat dari waktu penalaran yang lebih lama.
Tugas yang lebih sederhana ini biasanya menghasilkan hanya sekitar beberapa detik waktu berpikir.
Masalah optimisasi kendala
Masalah optimisasi kendala
Optimisasi kendala menantang Claude untuk memenuhi beberapa persyaratan yang bersaing secara bersamaan, yang paling baik dicapai ketika memungkinkan waktu pemikiran diperpanjang yang panjang sehingga model dapat secara metodis mengatasi setiap kendala.
Permintaan terbuka ini biasanya menghasilkan hanya sekitar beberapa detik waktu berpikir.
Kerangka pemikiran
Kerangka pemikiran
Kerangka pemikiran terstruktur memberikan Claude metodologi eksplisit untuk diikuti, yang mungkin bekerja terbaik ketika Claude diberi ruang pemikiran diperpanjang yang panjang untuk mengikuti setiap langkah.
Pertanyaan strategis luas ini biasanya menghasilkan hanya sekitar beberapa detik waktu berpikir.
Minta Claude merefleksikan dan memeriksa pekerjaannya untuk meningkatkan konsistensi dan penanganan kesalahan
Anda dapat menggunakan prompting bahasa alami sederhana untuk meningkatkan konsistensi dan mengurangi kesalahan:- Minta Claude untuk memverifikasi pekerjaannya dengan tes sederhana sebelum menyatakan tugas selesai
- Instruksikan model untuk menganalisis apakah langkah sebelumnya mencapai hasil yang diharapkan
- Untuk tugas coding, minta Claude untuk menjalankan kasus uji dalam pemikiran diperpanjangnya