Comment utiliser la vision
Utilisez les capacités de vision de Claude via :- claude.ai. Téléchargez une image comme vous le feriez pour un fichier, ou glissez-déposez une image directement dans la fenêtre de chat.
- Le Console Workbench. Si vous sélectionnez un modèle qui accepte les images (modèles Claude 3 et 4 uniquement), un bouton pour ajouter des images apparaît en haut à droite de chaque bloc de message utilisateur.
- Requête API. Voir les exemples dans ce guide.
Avant de télécharger
Bases et limites
Vous pouvez inclure plusieurs images dans une seule requête (jusqu’à 20 pour claude.ai et 100 pour les requêtes API). Claude analysera toutes les images fournies lors de la formulation de sa réponse. Cela peut être utile pour comparer ou contraster des images. Si vous soumettez une image plus grande que 8000x8000 px, elle sera rejetée. Si vous soumettez plus de 20 images dans une requête API, cette limite est de 2000x2000 px.Évaluer la taille de l’image
Pour des performances optimales, nous recommandons de redimensionner les images avant de les télécharger si elles sont trop grandes. Si le bord long de votre image dépasse 1568 pixels, ou si votre image dépasse environ 1 600 jetons, elle sera d’abord réduite, en préservant le rapport d’aspect, jusqu’à ce qu’elle soit dans les limites de taille. Si votre image d’entrée est trop grande et doit être redimensionnée, cela augmentera la latence du time-to-first-token, sans vous donner de performance de modèle supplémentaire. Les très petites images de moins de 200 pixels sur un bord donné peuvent dégrader les performances.| Rapport d’aspect | Taille de l’image |
|---|---|
| 1:1 | 1092x1092 px |
| 3:4 | 951x1268 px |
| 2:3 | 896x1344 px |
| 9:16 | 819x1456 px |
| 1:2 | 784x1568 px |
Calculer les coûts des images
Chaque image que vous incluez dans une requête à Claude compte dans votre utilisation de jetons. Pour calculer le coût approximatif, multipliez le nombre approximatif de jetons d’image par le prix par jeton du modèle que vous utilisez. Si votre image n’a pas besoin d’être redimensionnée, vous pouvez estimer le nombre de jetons utilisés via cet algorithme :jetons = (largeur px * hauteur px)/750
Voici des exemples de tokenisation approximative et de coûts pour différentes tailles d’image dans les contraintes de taille de notre API basées sur le prix par jeton de Claude Sonnet 3.7 de 3 $ par million de jetons d’entrée :
| Taille de l’image | Nombre de jetons | Coût / image | Coût / 1K images |
|---|---|---|---|
| 200x200 px(0,04 mégapixels) | ~54 | ~0,00016 $ | ~0,16 $ |
| 1000x1000 px(1 mégapixel) | ~1334 | ~0,004 $ | ~4,00 $ |
| 1092x1092 px(1,19 mégapixels) | ~1590 | ~0,0048 $ | ~4,80 $ |
Assurer la qualité de l’image
Lorsque vous fournissez des images à Claude, gardez à l’esprit les points suivants pour de meilleurs résultats :- Format d’image : Utilisez un format d’image pris en charge : JPEG, PNG, GIF ou WebP.
- Clarté de l’image : Assurez-vous que les images sont claires et pas trop floues ou pixelisées.
- Texte : Si l’image contient du texte important, assurez-vous qu’il est lisible et pas trop petit. Évitez de recadrer le contexte visuel clé juste pour agrandir le texte.
Exemples de prompts
Beaucoup des techniques d’invite qui fonctionnent bien pour les interactions basées sur du texte avec Claude peuvent également être appliquées aux invites basées sur des images. Ces exemples démontrent les meilleures structures d’invite impliquant des images.À propos des exemples d’invite
Les exemples suivants démontrent comment utiliser les capacités de vision de Claude en utilisant divers langages de programmation et approches. Vous pouvez fournir des images à Claude de trois façons :- Comme une image codée en base64 dans les blocs de contenu
image - Comme une référence URL à une image hébergée en ligne
- En utilisant l’API Files (télécharger une fois, utiliser plusieurs fois)
Exemple d’image codée en base64
Exemple d’image basée sur URL
Exemple d’image avec l’API Files
Pour les images que vous utiliserez à plusieurs reprises ou lorsque vous voulez éviter les frais généraux d’encodage, utilisez l’API Files :Exemple : Une image
Exemple : Une image
| Rôle | Contenu |
|---|---|
| Utilisateur | [Image] Describe this image. |
Exemple : Plusieurs images
Exemple : Plusieurs images
Image 1 : et Image 2 : et ainsi de suite. Vous n’avez pas besoin de sauts de ligne entre les images ou entre les images et l’invite.Demandez à Claude de décrire les différences entre plusieurs images.| Rôle | Contenu |
|---|---|
| Utilisateur | Image 1 : [Image 1] Image 2 : [Image 2] How are these images different? |
Exemple : Plusieurs images avec une invite système
Exemple : Plusieurs images avec une invite système
| Contenu | |
|---|---|
| Système | Respond only in Spanish. |
| Utilisateur | Image 1 : [Image 1] Image 2 : [Image 2] How are these images different? |
Exemple : Quatre images sur deux tours de conversation
Exemple : Quatre images sur deux tours de conversation
| Rôle | Contenu |
|---|---|
| Utilisateur | Image 1 : [Image 1] Image 2 : [Image 2] How are these images different? |
| Assistant | [Réponse de Claude] |
| Utilisateur | Image 1 : [Image 3] Image 2 : [Image 4] Are these images similar to the first two? |
| Assistant | [Réponse de Claude] |
user dans le cadre de toute structure de conversation multitour standard.Limitations
Bien que les capacités de compréhension d’images de Claude soient à la pointe de la technologie, il y a quelques limitations à connaître :- Identification des personnes : Claude ne peut pas être utilisé pour identifier (c’est-à-dire nommer) les personnes dans les images et refusera de le faire.
- Précision : Claude peut halluciner ou faire des erreurs lors de l’interprétation d’images de mauvaise qualité, tournées ou très petites de moins de 200 pixels.
- Raisonnement spatial : Les capacités de raisonnement spatial de Claude sont limitées. Il peut avoir du mal avec les tâches nécessitant une localisation précise ou des mises en page, comme lire le cadran d’une horloge analogique ou décrire les positions exactes des pièces d’échecs.
- Comptage : Claude peut donner des comptages approximatifs d’objets dans une image mais peut ne pas toujours être précis, en particulier avec un grand nombre de petits objets.
- Images générées par l’IA : Claude ne sait pas si une image est générée par l’IA et peut se tromper si on lui demande. Ne comptez pas sur lui pour détecter les images fausses ou synthétiques.
- Contenu inapproprié : Claude ne traitera pas les images inappropriées ou explicites qui violent notre Politique d’utilisation acceptable.
- Applications de santé : Bien que Claude puisse analyser les images médicales générales, il n’est pas conçu pour interpréter les analyses diagnostiques complexes telles que les tomodensitométries ou les IRM. Les résultats de Claude ne doivent pas être considérés comme un substitut aux conseils ou diagnostics médicaux professionnels.
FAQ
Quels types de fichiers image Claude supporte-t-il ?
Quels types de fichiers image Claude supporte-t-il ?
image/jpegimage/pngimage/gifimage/webp
Claude peut-il lire les URL d'images ?
Claude peut-il lire les URL d'images ?
Y a-t-il une limite à la taille du fichier image que je peux télécharger ?
Y a-t-il une limite à la taille du fichier image que je peux télécharger ?
- API : Maximum 5 Mo par image
- claude.ai : Maximum 10 Mo par image
Combien d'images puis-je inclure dans une requête ?
Combien d'images puis-je inclure dans une requête ?
- Messages API : Jusqu’à 100 images par requête
- claude.ai : Jusqu’à 20 images par tour
Claude lit-il les métadonnées d'image ?
Claude lit-il les métadonnées d'image ?
Puis-je supprimer les images que j'ai téléchargées ?
Puis-je supprimer les images que j'ai téléchargées ?
Où puis-je trouver des détails sur la confidentialité des données pour les téléchargements d'images ?
Où puis-je trouver des détails sur la confidentialité des données pour les téléchargements d'images ?
Et si l'interprétation d'image de Claude semble incorrecte ?
Et si l'interprétation d'image de Claude semble incorrecte ?
- Assurez-vous que l’image est claire, de haute qualité et correctement orientée.
- Essayez les techniques d’ingénierie d’invite pour améliorer les résultats.
- Si le problème persiste, signalez le résultat dans claude.ai (pouces vers le haut/vers le bas) ou contactez notre équipe d’assistance.
Claude peut-il générer ou modifier des images ?
Claude peut-il générer ou modifier des images ?
Approfondissez votre compréhension de la vision
Prêt à commencer à construire avec des images en utilisant Claude ? Voici quelques ressources utiles :- Multimodal cookbook : Ce cookbook contient des conseils sur la prise en main des images et les techniques de meilleures pratiques pour assurer les meilleures performances avec les images. Découvrez comment vous pouvez inviter efficacement Claude avec des images pour effectuer des tâches telles que l’interprétation et l’analyse de graphiques ou l’extraction de contenu à partir de formulaires.
- Référence API : Visitez notre documentation pour l’API Messages, y compris les exemples d’appels API impliquant des images.