Support PDF

Vous pouvez maintenant interroger Claude sur n’importe quel texte, images, graphiques et tableaux dans les PDF que vous fournissez. Quelques exemples d’utilisation :

Analyser des rapports financiers et comprendre les graphiques/tableaux
Extraire des informations clés de documents juridiques
Assistance à la traduction pour les documents
Convertir les informations de documents en formats structurés

Avant de commencer

Vérifiez les exigences PDF

Claude fonctionne avec n’importe quel PDF standard. Cependant, vous devez vous assurer que la taille de votre demande respecte ces exigences lors de l’utilisation du support PDF :

Exigence	Limite
Taille maximale de demande	32MB
Pages maximales par demande	100
Format	PDF standard (pas de mots de passe/chiffrement)

Veuillez noter que les deux limites s’appliquent à l’ensemble de la charge utile de la demande, y compris tout autre contenu envoyé avec les PDF. Étant donné que le support PDF s’appuie sur les capacités de vision de Claude, il est soumis aux mêmes limitations et considérations que les autres tâches de vision.

Plateformes et modèles pris en charge

Le support PDF est actuellement pris en charge via l’accès direct à l’API et Google Vertex AI. Tous les modèles actifs prennent en charge le traitement PDF. Le support PDF est maintenant disponible sur Amazon Bedrock avec les considérations suivantes :

Support PDF Amazon Bedrock

Lors de l’utilisation du support PDF via l’API Converse d’Amazon Bedrock, il existe deux modes distincts de traitement de documents :

Important : Pour accéder aux capacités complètes de compréhension visuelle PDF de Claude dans l’API Converse, vous devez activer les citations. Sans les citations activées, l’API revient à l’extraction de texte de base uniquement. En savoir plus sur travailler avec les citations.

Modes de traitement de documents

Chat de document Converse (Mode original - Extraction de texte uniquement)
- Fournit une extraction de texte de base à partir des PDF
- Ne peut pas analyser les images, graphiques ou mises en page visuelles dans les PDF
- Utilise environ 1 000 jetons pour un PDF de 3 pages
- Automatiquement utilisé lorsque les citations ne sont pas activées
Chat PDF Claude (Nouveau mode - Compréhension visuelle complète)
- Fournit une analyse visuelle complète des PDF
- Peut comprendre et analyser les graphiques, diagrammes, images et mises en page visuelles
- Traite chaque page à la fois comme texte et image pour une compréhension complète
- Utilise environ 7 000 jetons pour un PDF de 3 pages
- Nécessite que les citations soient activées dans l’API Converse

Limitations clés

API Converse : L’analyse visuelle PDF nécessite que les citations soient activées. Il n’y a actuellement aucune option pour utiliser l’analyse visuelle sans citations (contrairement à l’API InvokeModel).
API InvokeModel : Fournit un contrôle complet sur le traitement PDF sans citations forcées.

Problèmes courants

Si les clients signalent que Claude ne voit pas les images ou graphiques dans leurs PDF lors de l’utilisation de l’API Converse, ils doivent probablement activer le flag des citations. Sans cela, Converse revient à l’extraction de texte de base uniquement.

Il s’agit d’une contrainte connue avec l’API Converse que nous travaillons à résoudre. Pour les applications qui nécessitent une analyse visuelle PDF sans citations, envisagez d’utiliser l’API InvokeModel à la place.

Pour les fichiers non-PDF comme .csv, .xlsx, .docx, .md, ou .txt, voir Travailler avec d’autres formats de fichiers.

Traiter des PDF avec Claude

Envoyez votre première demande PDF

Commençons par un exemple simple utilisant l’API Messages. Vous pouvez fournir des PDF à Claude de trois façons :

Comme une référence URL vers un PDF hébergé en ligne
Comme un PDF encodé en base64 dans des blocs de contenu document
Par un file_id de l’API Files

Option 1 : Document PDF basé sur URL

L’approche la plus simple est de référencer un PDF directement depuis une URL :

 curl https://api.anthropic.com/v1/messages \
   -H "content-type: application/json" \
   -H "x-api-key: $ANTHROPIC_API_KEY" \
   -H "anthropic-version: 2023-06-01" \
   -d '{
     "model": "claude-sonnet-4-5",
     "max_tokens": 1024,
     "messages": [{
         "role": "user",
         "content": [{
             "type": "document",
             "source": {
                 "type": "url",
                 "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
             }
         },
         {
             "type": "text",
             "text": "Quelles sont les principales conclusions de ce document ?"
         }]
     }]
 }'

Option 2 : Document PDF encodé en Base64

Si vous devez envoyer des PDF depuis votre système local ou lorsqu’une URL n’est pas disponible :

# Méthode 1 : Récupérer et encoder un PDF distant
curl -s "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf" | base64 | tr -d '\n' > pdf_base64.txt

# Méthode 2 : Encoder un fichier PDF local
# base64 document.pdf | tr -d '\n' > pdf_base64.txt

# Créer un fichier de demande JSON utilisant le contenu pdf_base64.txt
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
    "model": "claude-sonnet-4-5",
    "max_tokens": 1024,
    "messages": [{
        "role": "user",
        "content": [{
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": $PDF_BASE64
            }
        },
        {
            "type": "text",
            "text": "Quelles sont les principales conclusions de ce document ?"
        }]
    }]
}' > request.json

# Envoyer la demande API en utilisant le fichier JSON
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Option 3 : API Files

Pour les PDF que vous utiliserez de manière répétée, ou lorsque vous voulez éviter la surcharge d’encodage, utilisez l’API Files :

# D'abord, téléchargez votre PDF vers l'API Files
curl -X POST https://api.anthropic.com/v1/files \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -F "[email protected]"

# Puis utilisez le file_id retourné dans votre message
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -d '{
    "model": "claude-sonnet-4-5", 
    "max_tokens": 1024,
    "messages": [{
      "role": "user",
      "content": [{
        "type": "document",
        "source": {
          "type": "file",
          "file_id": "file_abc123"
        }
      },
      {
        "type": "text",
        "text": "Quelles sont les principales conclusions de ce document ?"
      }]
    }]
  }'

Comment fonctionne le support PDF

Lorsque vous envoyez un PDF à Claude, les étapes suivantes se produisent :

Le système extrait le contenu du document.

Le système convertit chaque page du document en image.
Le texte de chaque page est extrait et fourni avec l’image de chaque page.

Claude analyse à la fois le texte et les images pour mieux comprendre le document.

Les documents sont fournis comme une combinaison de texte et d’images pour l’analyse.
Cela permet aux utilisateurs de demander des insights sur les éléments visuels d’un PDF, tels que les graphiques, diagrammes et autres contenus non textuels.

Claude répond, en référençant le contenu du PDF si pertinent.

Claude peut référencer à la fois le contenu textuel et visuel lorsqu’il répond. Vous pouvez améliorer davantage les performances en intégrant le support PDF avec :

Mise en cache des prompts : Pour améliorer les performances pour l’analyse répétée.
Traitement par lots : Pour le traitement de documents à haut volume.
Utilisation d’outils : Pour extraire des informations spécifiques des documents à utiliser comme entrées d’outils.

Estimez vos coûts

Le nombre de jetons d’un fichier PDF dépend du texte total extrait du document ainsi que du nombre de pages :

Coûts des jetons de texte : Chaque page utilise généralement 1 500-3 000 jetons par page selon la densité du contenu. La tarification API standard s’applique sans frais PDF supplémentaires.
Coûts des jetons d’image : Étant donné que chaque page est convertie en image, les mêmes calculs de coût basés sur l’image sont appliqués.

Vous pouvez utiliser le comptage de jetons pour estimer les coûts pour vos PDF spécifiques.

Optimiser le traitement PDF

Améliorer les performances

Suivez ces meilleures pratiques pour des résultats optimaux :

Placez les PDF avant le texte dans vos demandes
Utilisez des polices standard
Assurez-vous que le texte est clair et lisible
Faites pivoter les pages vers l’orientation droite appropriée
Utilisez des numéros de page logiques (du visualiseur PDF) dans les prompts
Divisez les gros PDF en morceaux si nécessaire
Activez la mise en cache des prompts pour l’analyse répétée

Mettre à l’échelle votre implémentation

Pour le traitement à haut volume, considérez ces approches :

Utiliser la mise en cache des prompts

Mettez en cache les PDF pour améliorer les performances sur les requêtes répétées :

# Créer un fichier de demande JSON utilisant le contenu pdf_base64.txt
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
    "model": "claude-sonnet-4-5",
    "max_tokens": 1024,
    "messages": [{
        "role": "user",
        "content": [{
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": $PDF_BASE64
            },
            "cache_control": {
              "type": "ephemeral"
            }
        },
        {
            "type": "text",
            "text": "Quel modèle a les taux de victoire de préférence humaine les plus élevés dans chaque cas d'usage ?"
        }]
    }]
}' > request.json

# Puis faire l'appel API en utilisant le fichier JSON
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Traiter des lots de documents

Utilisez l’API Message Batches pour les flux de travail à haut volume :

# Créer un fichier de demande JSON utilisant le contenu pdf_base64.txt
jq -n --rawfile PDF_BASE64 pdf_base64.txt '
{
  "requests": [
      {
          "custom_id": "my-first-request",
          "params": {
              "model": "claude-sonnet-4-5",
              "max_tokens": 1024,
              "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "document",
                            "source": {
 "type": "base64",
 "media_type": "application/pdf",
 "data": $PDF_BASE64
                            }
                        },
                        {
                            "type": "text",
                            "text": "Quel modèle a les taux de victoire de préférence humaine les plus élevés dans chaque cas d'usage ?"
                        }
                    ]
                }
              ]
          }
      },
      {
          "custom_id": "my-second-request",
          "params": {
              "model": "claude-sonnet-4-5",
              "max_tokens": 1024,
              "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "document",
                            "source": {
 "type": "base64",
 "media_type": "application/pdf",
 "data": $PDF_BASE64
                            }
                        },
                        {
                            "type": "text",
                            "text": "Extrayez 5 insights clés de ce document."
                        }
                    ]
                }
              ]
          }
      }
  ]
}
' > request.json

# Puis faire l'appel API en utilisant le fichier JSON
curl https://api.anthropic.com/v1/messages/batches \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Prochaines étapes

Essayez les exemples PDF

Explorez des exemples pratiques de traitement PDF dans notre recette de livre de cuisine.

Voir la référence API

Voir la documentation API complète pour le support PDF.

Premiers pas

Modèles et tarification

Créer avec Claude

Capacités

Outils

Compétences de l'Agent

SDK Agent

MCP dans l'API

Claude sur les plateformes tierces

Ingénierie des prompts

Tester et évaluer

Renforcer les garde-fous

Avant de commencer

Vérifiez les exigences PDF

Plateformes et modèles pris en charge

Support PDF Amazon Bedrock

Modes de traitement de documents

Limitations clés

Problèmes courants

Traiter des PDF avec Claude

Envoyez votre première demande PDF

Option 1 : Document PDF basé sur URL

Option 2 : Document PDF encodé en Base64

Option 3 : API Files

Comment fonctionne le support PDF

Estimez vos coûts

Optimiser le traitement PDF

Améliorer les performances

Mettre à l’échelle votre implémentation

Utiliser la mise en cache des prompts

Traiter des lots de documents

Prochaines étapes

Essayez les exemples PDF

Voir la référence API

Premiers pas

Modèles et tarification

Créer avec Claude

Capacités

Outils

Compétences de l'Agent

SDK Agent

MCP dans l'API

Claude sur les plateformes tierces

Ingénierie des prompts

Tester et évaluer

Renforcer les garde-fous

​Avant de commencer

​Vérifiez les exigences PDF

​Plateformes et modèles pris en charge

​Support PDF Amazon Bedrock

​Modes de traitement de documents

​Limitations clés

​Problèmes courants

​Traiter des PDF avec Claude

​Envoyez votre première demande PDF

​Option 1 : Document PDF basé sur URL

​Option 2 : Document PDF encodé en Base64

​Option 3 : API Files

​Comment fonctionne le support PDF

​Estimez vos coûts

​Optimiser le traitement PDF

​Améliorer les performances

​Mettre à l’échelle votre implémentation

​Utiliser la mise en cache des prompts

​Traiter des lots de documents

​Prochaines étapes

Essayez les exemples PDF

Voir la référence API

Avant de commencer

Vérifiez les exigences PDF

Plateformes et modèles pris en charge

Support PDF Amazon Bedrock

Modes de traitement de documents

Limitations clés

Problèmes courants

Traiter des PDF avec Claude

Envoyez votre première demande PDF

Option 1 : Document PDF basé sur URL

Option 2 : Document PDF encodé en Base64

Option 3 : API Files

Comment fonctionne le support PDF

Estimez vos coûts

Optimiser le traitement PDF

Améliorer les performances

Mettre à l’échelle votre implémentation

Utiliser la mise en cache des prompts

Traiter des lots de documents

Prochaines étapes