Antes de mergulhar
Este guia pressupõe que você já decidiu usar o modo de pensamento estendido e revisou nossos passos básicos sobre como começar com o pensamento estendido bem como nosso guia de implementação de pensamento estendido.Considerações técnicas para o pensamento estendido
- Os tokens de pensamento têm um orçamento mínimo de 1024 tokens. Recomendamos que você comece com o orçamento mínimo de pensamento e aumente incrementalmente para ajustar com base em suas necessidades e complexidade da tarefa.
- Para cargas de trabalho onde o orçamento ideal de pensamento está acima de 32K, recomendamos que você use processamento em lote para evitar problemas de rede. Solicitações que empurram o modelo a pensar acima de 32K tokens causam solicitações de longa duração que podem esbarrar em timeouts do sistema e limites de conexão aberta.
- O pensamento estendido funciona melhor em inglês, embora as saídas finais possam estar em qualquer idioma que o Claude suporte.
- Se você precisar de pensamento abaixo do orçamento mínimo, recomendamos usar o modo padrão, com o pensamento desligado, com prompting tradicional de cadeia de pensamento com tags XML (como
<thinking>). Veja prompting de cadeia de pensamento.
Técnicas de prompting para pensamento estendido
Use instruções gerais primeiro, depois solucione problemas com instruções mais passo a passo
O Claude frequentemente tem melhor desempenho com instruções de alto nível para apenas pensar profundamente sobre uma tarefa em vez de orientação prescritiva passo a passo. A criatividade do modelo na abordagem de problemas pode exceder a capacidade humana de prescrever o processo de pensamento ideal. Por exemplo, em vez de:Prompting multishot com pensamento estendido
Prompting multishot funciona bem com pensamento estendido. Quando você fornece ao Claude exemplos de como pensar através de problemas, ele seguirá padrões de raciocínio similares dentro de seus blocos de pensamento estendido. Você pode incluir exemplos few-shot em seu prompt em cenários de pensamento estendido usando tags XML como<thinking> ou <scratchpad> para indicar padrões canônicos de pensamento estendido nesses exemplos.
O Claude generalizará o padrão para o processo formal de pensamento estendido. No entanto, é possível que você obtenha melhores resultados dando ao Claude rédea solta para pensar da maneira que ele julgar melhor.
Exemplo:
Maximizando o seguimento de instruções com pensamento estendido
O Claude mostra seguimento de instruções significativamente melhorado quando o pensamento estendido está habilitado. O modelo tipicamente:- Raciocina sobre instruções dentro do bloco de pensamento estendido
- Executa essas instruções na resposta
- Seja claro e específico sobre o que você quer
- Para instruções complexas, considere dividi-las em passos numerados que o Claude deve trabalhar metodicamente
- Permita ao Claude orçamento suficiente para processar as instruções completamente em seu pensamento estendido
Usando pensamento estendido para debugar e direcionar o comportamento do Claude
Você pode usar a saída de pensamento do Claude para debugar a lógica do Claude, embora este método nem sempre seja perfeitamente confiável. Para fazer o melhor uso desta metodologia, recomendamos as seguintes dicas:- Não recomendamos passar o pensamento estendido do Claude de volta no bloco de texto do usuário, pois isso não melhora o desempenho e pode realmente degradar os resultados.
- Pré-preenchimento de pensamento estendido é explicitamente não permitido, e alterar manualmente o texto de saída do modelo que segue seu bloco de pensamento provavelmente vai degradar os resultados devido à confusão do modelo.
assistant ainda é permitido.
Às vezes o Claude pode repetir seu pensamento estendido no texto de saída do assistente. Se você quiser uma resposta limpa, instrua o Claude a não repetir seu pensamento estendido e apenas produzir a resposta.
Aproveitando ao máximo saídas longas e pensamento de forma longa
Para casos de uso de geração de conjuntos de dados, tente prompts como “Por favor, crie uma tabela extremamente detalhada de…” para gerar conjuntos de dados abrangentes. Para casos de uso como geração de conteúdo detalhado onde você pode querer gerar blocos de pensamento estendido mais longos e respostas mais detalhadas, tente estas dicas:- Aumente tanto o comprimento máximo de pensamento estendido E explicitamente peça por saídas mais longas
- Para saídas muito longas (20.000+ palavras), solicite um esboço detalhado com contagens de palavras até o nível do parágrafo. Então peça ao Claude para indexar seus parágrafos ao esboço e manter as contagens de palavras especificadas
Não recomendamos que você empurre o Claude a produzir mais tokens pelo bem de produzir tokens. Em vez disso, encorajamos você a começar com um pequeno orçamento de pensamento e aumentar conforme necessário para encontrar as configurações ideais para seu caso de uso.
Problemas complexos de STEM
Problemas complexos de STEM
Problemas complexos de STEM requerem que o Claude construa modelos mentais, aplique conhecimento especializado e trabalhe através de passos lógicos sequenciais—processos que se beneficiam de tempo de raciocínio mais longo.
Esta tarefa mais simples tipicamente resulta em apenas alguns segundos de tempo de pensamento.
Problemas de otimização com restrições
Problemas de otimização com restrições
Otimização com restrições desafia o Claude a satisfazer múltiplos requisitos competitivos simultaneamente, o que é melhor realizado quando se permite tempo longo de pensamento estendido para que o modelo possa abordar metodicamente cada restrição.
Esta solicitação aberta tipicamente resulta em apenas alguns segundos de tempo de pensamento.
Frameworks de pensamento
Frameworks de pensamento
Frameworks de pensamento estruturados dão ao Claude uma metodologia explícita para seguir, o que pode funcionar melhor quando o Claude recebe espaço longo de pensamento estendido para seguir cada passo.
Esta questão estratégica ampla tipicamente resulta em apenas alguns segundos de tempo de pensamento.
Faça o Claude refletir e verificar seu trabalho para melhor consistência e tratamento de erros
Você pode usar prompting em linguagem natural simples para melhorar a consistência e reduzir erros:- Peça ao Claude para verificar seu trabalho com um teste simples antes de declarar uma tarefa completa
- Instrua o modelo a analisar se seu passo anterior alcançou o resultado esperado
- Para tarefas de codificação, peça ao Claude para executar casos de teste em seu pensamento estendido