Vision

Ce guide décrit comment travailler avec les images dans Claude, y compris les meilleures pratiques, les exemples de code et les limitations à garder à l’esprit.

Comment utiliser la vision

Utilisez les capacités de vision de Claude via :

claude.ai. Téléchargez une image comme vous le feriez pour un fichier, ou glissez-déposez une image directement dans la fenêtre de chat.
Le Console Workbench. Si vous sélectionnez un modèle qui accepte les images (modèles Claude 3 et 4 uniquement), un bouton pour ajouter des images apparaît en haut à droite de chaque bloc de message Utilisateur.
Requête API. Voir les exemples dans ce guide.

Avant de télécharger

Bases et limites

Vous pouvez inclure plusieurs images dans une seule requête (jusqu’à 20 pour claude.ai et 100 pour les requêtes API). Claude analysera toutes les images fournies lors de la formulation de sa réponse. Cela peut être utile pour comparer ou contraster des images. Si vous soumettez une image plus grande que 8000x8000 px, elle sera rejetée. Si vous soumettez plus de 20 images dans une requête API, cette limite est de 2000x2000 px.

Bien que l’API prenne en charge 100 images par requête, il existe une limite de taille de requête de 32 Mo pour les points de terminaison standard.

Évaluer la taille de l’image

Pour des performances optimales, nous recommandons de redimensionner les images avant de les télécharger si elles sont trop grandes. Si le bord long de votre image fait plus de 1568 pixels, ou si votre image fait plus de ~1 600 jetons, elle sera d’abord réduite, en préservant le rapport d’aspect, jusqu’à ce qu’elle soit dans les limites de taille. Si votre image d’entrée est trop grande et doit être redimensionnée, cela augmentera la latence du temps jusqu’au premier jeton, sans vous donner de performance de modèle supplémentaire. Les très petites images de moins de 200 pixels sur un bord donné peuvent dégrader les performances.

Pour améliorer le temps jusqu’au premier jeton, nous recommandons de redimensionner les images à pas plus de 1,15 mégapixels (et dans les 1568 pixels dans les deux dimensions).

Voici un tableau des tailles d’image maximales acceptées par notre API qui ne seront pas redimensionnées pour les rapports d’aspect courants. Avec le modèle Claude Sonnet 3.7, ces images utilisent environ 1 600 jetons et environ 4,80 $/1K images.

Rapport d’aspect	Taille d’image
1:1	1092x1092 px
3:4	951x1268 px
2:3	896x1344 px
9:16	819x1456 px
1:2	784x1568 px

Calculer les coûts d’image

Chaque image que vous incluez dans une requête à Claude compte dans votre utilisation de jetons. Pour calculer le coût approximatif, multipliez le nombre approximatif de jetons d’image par le prix par jeton du modèle que vous utilisez. Si votre image n’a pas besoin d’être redimensionnée, vous pouvez estimer le nombre de jetons utilisés grâce à cet algorithme : jetons = (largeur px * hauteur px)/750 Voici des exemples de tokenisation approximative et de coûts pour différentes tailles d’image dans les contraintes de taille de notre API basés sur le prix par jeton de Claude Sonnet 3.7 de 3 $ par million de jetons d’entrée :

Taille d’image	Nb de jetons	Coût / image	Coût / 1K images
200x200 px(0,04 mégapixels)	~54	~0,00016 $	~0,16 $
1000x1000 px(1 mégapixel)	~1334	~0,004 $	~4,00 $
1092x1092 px(1,19 mégapixels)	~1590	~0,0048 $	~4,80 $

Assurer la qualité de l’image

Lors de la fourniture d’images à Claude, gardez les éléments suivants à l’esprit pour de meilleurs résultats :

Format d’image : Utilisez un format d’image pris en charge : JPEG, PNG, GIF ou WebP.
Clarté de l’image : Assurez-vous que les images sont claires et pas trop floues ou pixellisées.
Texte : Si l’image contient du texte important, assurez-vous qu’il est lisible et pas trop petit. Évitez de rogner le contexte visuel clé juste pour agrandir le texte.

Exemples de prompts

Beaucoup des techniques de prompting qui fonctionnent bien pour les interactions textuelles avec Claude peuvent également être appliquées aux prompts basés sur des images. Ces exemples démontrent les structures de prompt de meilleures pratiques impliquant des images.

Tout comme avec le placement de requête de document, Claude fonctionne mieux lorsque les images viennent avant le texte. Les images placées après le texte ou interpolées avec le texte fonctionneront toujours bien, mais si votre cas d’usage le permet, nous recommandons une structure image-puis-texte.

À propos des exemples de prompts

Les exemples suivants démontrent comment utiliser les capacités de vision de Claude en utilisant divers langages de programmation et approches. Vous pouvez fournir des images à Claude de trois façons :

Comme une image encodée en base64 dans des blocs de contenu image
Comme une référence URL vers une image hébergée en ligne
En utilisant l’API Files (télécharger une fois, utiliser plusieurs fois)

Les exemples de prompts base64 utilisent ces variables :

    # Pour les images basées sur URL, vous pouvez utiliser l'URL directement dans votre requête JSON
    
    # Pour les images encodées en base64, vous devez d'abord encoder l'image
    # Exemple de comment encoder une image en base64 en bash :
    BASE64_IMAGE_DATA=$(curl -s "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg" | base64)
    
    # Les données encodées peuvent maintenant être utilisées dans vos appels API

Voici des exemples de comment inclure des images dans une requête API Messages en utilisant des images encodées en base64 et des références URL :

Exemple d’image encodée en base64

curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-sonnet-4-5",
    "max_tokens": 1024,
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "image",
            "source": {
              "type": "base64",
              "media_type": "image/jpeg",
              "data": "'"$BASE64_IMAGE_DATA"'"
            }
          },
          {
            "type": "text",
            "text": "Décrivez cette image."
          }
        ]
      }
    ]
  }'

Exemple d’image basée sur URL

curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-sonnet-4-5",
    "max_tokens": 1024,
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "image",
            "source": {
              "type": "url",
              "url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
            }
          },
          {
            "type": "text",
            "text": "Décrivez cette image."
          }
        ]
      }
    ]
  }'

Exemple d’image API Files

Pour les images que vous utiliserez de manière répétée ou lorsque vous voulez éviter la surcharge d’encodage, utilisez l’API Files :

# D'abord, téléchargez votre image vers l'API Files
curl -X POST https://api.anthropic.com/v1/files \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -F "[email protected]"

# Ensuite utilisez le file_id retourné dans votre message
curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-sonnet-4-5",
    "max_tokens": 1024,
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "image",
            "source": {
              "type": "file",
              "file_id": "file_abc123"
            }
          },
          {
            "type": "text",
            "text": "Décrivez cette image."
          }
        ]
      }
    ]
  }'

Voir Exemples d’API Messages pour plus d’exemples de code et de détails sur les paramètres.

Exemple : Une image

Il est préférable de placer les images plus tôt dans le prompt que les questions à leur sujet ou les instructions pour les tâches qui les utilisent.Demandez à Claude de décrire une image.

Rôle	Contenu
Utilisateur	[Image] Décrivez cette image.

Voici l’appel API correspondant utilisant le modèle Claude Sonnet 3.7.

Python

message = client.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image1_media_type,
                        "data": image1_data,
                    },
                },
                {
                    "type": "text",
                    "text": "Décrivez cette image."
                }
            ],
        }
    ],
)

Exemple : Plusieurs images

Dans les situations où il y a plusieurs images, introduisez chaque image avec Image 1 : et Image 2 : et ainsi de suite. Vous n’avez pas besoin de nouvelles lignes entre les images ou entre les images et le prompt.Demandez à Claude de décrire les différences entre plusieurs images.

Rôle	Contenu
Utilisateur	Image 1 : [Image 1] Image 2 : [Image 2] En quoi ces images sont-elles différentes ?

Voici l’appel API correspondant utilisant le modèle Claude Sonnet 3.7.

Python

message = client.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Image 1 :"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image1_media_type,
                        "data": image1_data,
                    },
                },
                {
                    "type": "text",
                    "text": "Image 2 :"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image2_media_type,
                        "data": image2_data,
                    },
                },
                {
                    "type": "text",
                    "text": "En quoi ces images sont-elles différentes ?"
                }
            ],
        }
    ],
)

Exemple : Plusieurs images avec un prompt système

Demandez à Claude de décrire les différences entre plusieurs images, tout en lui donnant un prompt système sur comment répondre.

Contenu
Système	Répondez uniquement en espagnol.
Utilisateur	Image 1 : [Image 1] Image 2 : [Image 2] En quoi ces images sont-elles différentes ?

Voici l’appel API correspondant utilisant le modèle Claude Sonnet 3.7.

Python

message = client.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=1024,
    system="Répondez uniquement en espagnol.",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Image 1 :"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image1_media_type,
                        "data": image1_data,
                    },
                },
                {
                    "type": "text",
                    "text": "Image 2 :"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image2_media_type,
                        "data": image2_data,
                    },
                },
                {
                    "type": "text",
                    "text": "En quoi ces images sont-elles différentes ?"
                }
            ],
        }
    ],
)

Exemple : Quatre images sur deux tours de conversation

Les capacités de vision de Claude brillent dans les conversations multimodales qui mélangent images et texte. Vous pouvez avoir des échanges prolongés avec Claude, en ajoutant de nouvelles images ou des questions de suivi à tout moment. Cela permet des flux de travail puissants pour l’analyse d’image itérative, la comparaison, ou la combinaison de visuels avec d’autres connaissances.Demandez à Claude de contraster deux images, puis posez une question de suivi comparant les premières images à deux nouvelles images.

Rôle	Contenu
Utilisateur	Image 1 : [Image 1] Image 2 : [Image 2] En quoi ces images sont-elles différentes ?
Assistant	[Réponse de Claude]
Utilisateur	Image 1 : [Image 3] Image 2 : [Image 4] Ces images sont-elles similaires aux deux premières ?
Assistant	[Réponse de Claude]

Lors de l’utilisation de l’API, insérez simplement de nouvelles images dans le tableau de Messages dans le rôle user dans le cadre de toute structure de conversation multi-tours standard.

Limitations

Bien que les capacités de compréhension d’image de Claude soient à la pointe de la technologie, il y a certaines limitations à connaître :

Identification de personnes : Claude ne peut pas être utilisé pour identifier (c’est-à-dire nommer) des personnes dans les images et refusera de le faire.
Précision : Claude peut halluciner ou faire des erreurs lors de l’interprétation d’images de faible qualité, tournées, ou très petites de moins de 200 pixels.
Raisonnement spatial : Les capacités de raisonnement spatial de Claude sont limitées. Il peut avoir des difficultés avec des tâches nécessitant une localisation précise ou des mises en page, comme lire un cadran d’horloge analogique ou décrire les positions exactes des pièces d’échecs.
Comptage : Claude peut donner des comptes approximatifs d’objets dans une image mais peut ne pas toujours être précisément exact, surtout avec de grands nombres de petits objets.
Images générées par IA : Claude ne sait pas si une image est générée par IA et peut être incorrect si on lui demande. Ne comptez pas sur lui pour détecter des images fausses ou synthétiques.
Contenu inapproprié : Claude ne traitera pas d’images inappropriées ou explicites qui violent notre Politique d’utilisation acceptable.
Applications de santé : Bien que Claude puisse analyser des images médicales générales, il n’est pas conçu pour interpréter des scans diagnostiques complexes tels que les CT ou IRM. Les sorties de Claude ne doivent pas être considérées comme un substitut à un conseil médical professionnel ou un diagnostic.

Examinez et vérifiez toujours soigneusement les interprétations d’image de Claude, surtout pour les cas d’usage à enjeux élevés. N’utilisez pas Claude pour des tâches nécessitant une précision parfaite ou une analyse d’image sensible sans supervision humaine.

FAQ

Quels types de fichiers d'image Claude prend-il en charge ?

Claude prend actuellement en charge les formats d’image JPEG, PNG, GIF et WebP, spécifiquement :

image/jpeg
image/png
image/gif
image/webp

Claude peut-il lire les URLs d'images ?

Oui, Claude peut maintenant traiter les images à partir d’URLs avec nos blocs de source d’image URL dans l’API. Utilisez simplement le type de source “url” au lieu de “base64” dans vos requêtes API. Exemple :

{
  "type": "image",
  "source": {
    "type": "url",
    "url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
  }
}

Y a-t-il une limite à la taille de fichier d'image que je peux télécharger ?

Oui, il y a des limites :

API : Maximum 5 Mo par image
claude.ai : Maximum 10 Mo par image

Les images plus grandes que ces limites seront rejetées et retourneront une erreur lors de l’utilisation de notre API.

Combien d'images puis-je inclure dans une requête ?

Les limites d’image sont :

API Messages : Jusqu’à 100 images par requête
claude.ai : Jusqu’à 20 images par tour

Les requêtes dépassant ces limites seront rejetées et retourneront une erreur.

Claude lit-il les métadonnées d'image ?

Non, Claude n’analyse ni ne reçoit de métadonnées des images qui lui sont transmises.

Puis-je supprimer les images que j'ai téléchargées ?

Non. Les téléchargements d’images sont éphémères et ne sont pas stockés au-delà de la durée de la requête API. Les images téléchargées sont automatiquement supprimées après avoir été traitées.

Où puis-je trouver des détails sur la confidentialité des données pour les téléchargements d'images ?

Veuillez vous référer à notre page de politique de confidentialité pour des informations sur la façon dont nous gérons les images téléchargées et autres données. Nous n’utilisons pas les images téléchargées pour entraîner nos modèles.

Que faire si l'interprétation d'image de Claude semble incorrecte ?

Si l’interprétation d’image de Claude semble incorrecte :

Assurez-vous que l’image est claire, de haute qualité et correctement orientée.
Essayez des techniques d’ingénierie de prompt pour améliorer les résultats.
Si le problème persiste, signalez la sortie dans claude.ai (pouce vers le haut/bas) ou contactez notre équipe de support.

Vos commentaires nous aident à nous améliorer !

Claude peut-il générer ou éditer des images ?

Non, Claude est un modèle de compréhension d’image uniquement. Il peut interpréter et analyser des images, mais il ne peut pas générer, produire, éditer, manipuler ou créer des images.

Plongez plus profondément dans la vision

Prêt à commencer à construire avec des images en utilisant Claude ? Voici quelques ressources utiles :

Livre de recettes multimodal : Ce livre de recettes a des conseils sur comment commencer avec les images et les techniques de meilleures pratiques pour assurer la performance de la plus haute qualité avec les images. Voyez comment vous pouvez efficacement prompter Claude avec des images pour effectuer des tâches telles que interpréter et analyser des graphiques ou extraire du contenu de formulaires.
Référence API : Visitez notre documentation pour l’API Messages, incluant des exemples d’appels API impliquant des images.

Si vous avez d’autres questions, n’hésitez pas à contacter notre équipe de support. Vous pouvez également rejoindre notre communauté de développeurs pour vous connecter avec d’autres créateurs et obtenir de l’aide d’experts Anthropic.

Premiers pas

Modèles et tarification

Créer avec Claude

Capacités

Outils

Compétences de l'Agent

SDK Agent

MCP dans l'API

Claude sur les plateformes tierces

Ingénierie des prompts

Tester et évaluer

Renforcer les garde-fous

Comment utiliser la vision

Avant de télécharger

Bases et limites

Évaluer la taille de l’image

Calculer les coûts d’image

Assurer la qualité de l’image

Exemples de prompts

À propos des exemples de prompts

Exemple d’image encodée en base64

Exemple d’image basée sur URL

Exemple d’image API Files

Limitations

FAQ

Plongez plus profondément dans la vision

Premiers pas

Modèles et tarification

Créer avec Claude

Capacités

Outils

Compétences de l'Agent

SDK Agent

MCP dans l'API

Claude sur les plateformes tierces

Ingénierie des prompts

Tester et évaluer

Renforcer les garde-fous

​Comment utiliser la vision

​Avant de télécharger

​Bases et limites

​Évaluer la taille de l’image

​Calculer les coûts d’image

​Assurer la qualité de l’image

​Exemples de prompts

​À propos des exemples de prompts

​Exemple d’image encodée en base64

​Exemple d’image basée sur URL

​Exemple d’image API Files

​Limitations

​FAQ

​Plongez plus profondément dans la vision

Comment utiliser la vision

Avant de télécharger

Bases et limites

Évaluer la taille de l’image

Calculer les coûts d’image

Assurer la qualité de l’image

Exemples de prompts

À propos des exemples de prompts

Exemple d’image encodée en base64

Exemple d’image basée sur URL

Exemple d’image API Files

Limitations

FAQ

Plongez plus profondément dans la vision