Como usar a visão
Use as capacidades de visão do Claude através de:- claude.ai. Carregue uma imagem como você faria com um arquivo, ou arraste e solte uma imagem diretamente na janela de chat.
- O Console Workbench. Se você selecionar um modelo que aceita imagens (apenas modelos Claude 3 e 4), um botão para adicionar imagens aparece no canto superior direito de cada bloco de mensagem do Usuário.
- Solicitação de API. Veja os exemplos neste guia.
Antes de fazer upload
Básico e Limites
Você pode incluir múltiplas imagens em uma única solicitação (até 20 para claude.ai e 100 para solicitações de API). Claude analisará todas as imagens fornecidas ao formular sua resposta. Isso pode ser útil para comparar ou contrastar imagens. Se você enviar uma imagem maior que 8000x8000 px, ela será rejeitada. Se você enviar mais de 20 imagens em uma solicitação de API, este limite é de 2000x2000 px.Avaliar tamanho da imagem
Para desempenho ideal, recomendamos redimensionar imagens antes de fazer upload se elas forem muito grandes. Se a borda longa da sua imagem for maior que 1568 pixels, ou sua imagem for maior que ~1.600 tokens, ela será primeiro reduzida, preservando a proporção, até estar dentro dos limites de tamanho. Se sua imagem de entrada for muito grande e precisar ser redimensionada, isso aumentará a latência do tempo até o primeiro token, sem lhe dar nenhum desempenho adicional do modelo. Imagens muito pequenas com menos de 200 pixels em qualquer borda podem degradar o desempenho.| Proporção | Tamanho da imagem |
|---|---|
| 1:1 | 1092x1092 px |
| 3:4 | 951x1268 px |
| 2:3 | 896x1344 px |
| 9:16 | 819x1456 px |
| 1:2 | 784x1568 px |
Calcular custos de imagem
Cada imagem que você inclui em uma solicitação ao Claude conta para seu uso de tokens. Para calcular o custo aproximado, multiplique o número aproximado de tokens de imagem pelo preço por token do modelo que você está usando. Se sua imagem não precisar ser redimensionada, você pode estimar o número de tokens usados através deste algoritmo:tokens = (largura px * altura px)/750
Aqui estão exemplos de tokenização aproximada e custos para diferentes tamanhos de imagem dentro das restrições de tamanho da nossa API baseados no preço por token do Claude Sonnet 3.7 de $3 por milhão de tokens de entrada:
| Tamanho da imagem | Nº de Tokens | Custo / imagem | Custo / 1K imagens |
|---|---|---|---|
| 200x200 px(0,04 megapixels) | ~54 | ~$0,00016 | ~$0,16 |
| 1000x1000 px(1 megapixel) | ~1334 | ~$0,004 | ~$4,00 |
| 1092x1092 px(1,19 megapixels) | ~1590 | ~$0,0048 | ~$4,80 |
Garantindo qualidade da imagem
Ao fornecer imagens ao Claude, tenha em mente o seguinte para melhores resultados:- Formato da imagem: Use um formato de imagem suportado: JPEG, PNG, GIF ou WebP.
- Clareza da imagem: Certifique-se de que as imagens estejam claras e não muito borradas ou pixelizadas.
- Texto: Se a imagem contém texto importante, certifique-se de que seja legível e não muito pequeno. Evite cortar contexto visual importante apenas para ampliar o texto.
Exemplos de prompt
Muitas das técnicas de prompting que funcionam bem para interações baseadas em texto com Claude também podem ser aplicadas a prompts baseados em imagem. Esses exemplos demonstram estruturas de prompt de melhores práticas envolvendo imagens.Sobre os exemplos de prompt
Os exemplos a seguir demonstram como usar as capacidades de visão do Claude usando várias linguagens de programação e abordagens. Você pode fornecer imagens ao Claude de três maneiras:- Como uma imagem codificada em base64 em blocos de conteúdo
image - Como uma referência de URL para uma imagem hospedada online
- Usando a API de Arquivos (carregue uma vez, use múltiplas vezes)
Exemplo de imagem codificada em base64
Exemplo de imagem baseada em URL
Exemplo de imagem da API de Arquivos
Para imagens que você usará repetidamente ou quando quiser evitar sobrecarga de codificação, use a API de Arquivos:Exemplo: Uma imagem
Exemplo: Uma imagem
| Papel | Conteúdo |
|---|---|
| Usuário | [Imagem] Descreva esta imagem. |
Exemplo: Múltiplas imagens
Exemplo: Múltiplas imagens
Imagem 1: e Imagem 2: e assim por diante. Você não precisa de quebras de linha entre imagens ou entre imagens e o prompt.Peça ao Claude para descrever as diferenças entre múltiplas imagens.| Papel | Conteúdo |
|---|---|
| Usuário | Imagem 1: [Imagem 1] Imagem 2: [Imagem 2] Como essas imagens são diferentes? |
Exemplo: Múltiplas imagens com um prompt de sistema
Exemplo: Múltiplas imagens com um prompt de sistema
| Conteúdo | |
|---|---|
| Sistema | Responda apenas em espanhol. |
| Usuário | Imagem 1: [Imagem 1] Imagem 2: [Imagem 2] Como essas imagens são diferentes? |
Exemplo: Quatro imagens em duas rodadas de conversa
Exemplo: Quatro imagens em duas rodadas de conversa
| Papel | Conteúdo |
|---|---|
| Usuário | Imagem 1: [Imagem 1] Imagem 2: [Imagem 2] Como essas imagens são diferentes? |
| Assistente | [Resposta do Claude] |
| Usuário | Imagem 1: [Imagem 3] Imagem 2: [Imagem 4] Essas imagens são similares às duas primeiras? |
| Assistente | [Resposta do Claude] |
user como parte de qualquer estrutura padrão de conversa multi-turno.Limitações
Embora as capacidades de compreensão de imagem do Claude sejam de ponta, há algumas limitações a serem consideradas:- Identificação de pessoas: Claude não pode ser usado para identificar (ou seja, nomear) pessoas em imagens e se recusará a fazê-lo.
- Precisão: Claude pode alucinar ou cometer erros ao interpretar imagens de baixa qualidade, rotacionadas ou muito pequenas com menos de 200 pixels.
- Raciocínio espacial: As habilidades de raciocínio espacial do Claude são limitadas. Ele pode ter dificuldades com tarefas que requerem localização precisa ou layouts, como ler o mostrador de um relógio analógico ou descrever posições exatas de peças de xadrez.
- Contagem: Claude pode dar contagens aproximadas de objetos em uma imagem, mas pode nem sempre ser precisamente exato, especialmente com grandes números de objetos pequenos.
- Imagens geradas por IA: Claude não sabe se uma imagem é gerada por IA e pode estar incorreto se perguntado. Não confie nele para detectar imagens falsas ou sintéticas.
- Conteúdo inadequado: Claude não processará imagens inadequadas ou explícitas que violem nossa Política de Uso Aceitável.
- Aplicações de saúde: Embora Claude possa analisar imagens médicas gerais, ele não é projetado para interpretar exames diagnósticos complexos como TCs ou RMs. As saídas do Claude não devem ser consideradas um substituto para aconselhamento médico profissional ou diagnóstico.
FAQ
Quais tipos de arquivo de imagem o Claude suporta?
Quais tipos de arquivo de imagem o Claude suporta?
image/jpegimage/pngimage/gifimage/webp
O Claude pode ler URLs de imagem?
O Claude pode ler URLs de imagem?
Há um limite para o tamanho do arquivo de imagem que posso carregar?
Há um limite para o tamanho do arquivo de imagem que posso carregar?
- API: Máximo de 5MB por imagem
- claude.ai: Máximo de 10MB por imagem
Quantas imagens posso incluir em uma solicitação?
Quantas imagens posso incluir em uma solicitação?
- API de Mensagens: Até 100 imagens por solicitação
- claude.ai: Até 20 imagens por turno
O Claude lê metadados de imagem?
O Claude lê metadados de imagem?
Posso deletar imagens que carreguei?
Posso deletar imagens que carreguei?
Onde posso encontrar detalhes sobre privacidade de dados para uploads de imagem?
Onde posso encontrar detalhes sobre privacidade de dados para uploads de imagem?
E se a interpretação de imagem do Claude parecer errada?
E se a interpretação de imagem do Claude parecer errada?
- Certifique-se de que a imagem esteja clara, de alta qualidade e corretamente orientada.
- Tente técnicas de engenharia de prompt para melhorar os resultados.
- Se o problema persistir, sinalize a saída no claude.ai (polegar para cima/baixo) ou entre em contato com nossa equipe de suporte.
O Claude pode gerar ou editar imagens?
O Claude pode gerar ou editar imagens?
Mergulhe mais fundo na visão
Pronto para começar a construir com imagens usando Claude? Aqui estão alguns recursos úteis:- Cookbook multimodal: Este cookbook tem dicas sobre começar com imagens e técnicas de melhores práticas para garantir o desempenho de mais alta qualidade com imagens. Veja como você pode efetivamente fazer prompt ao Claude com imagens para realizar tarefas como interpretar e analisar gráficos ou extrair conteúdo de formulários.
- Referência da API: Visite nossa documentação para a API de Mensagens, incluindo exemplo de chamadas de API envolvendo imagens.