L’outil de récupération web est actuellement en version bêta. Pour l’activer, utilisez l’en-tête bêta
web-fetch-2025-09-10 dans vos demandes d’API.Veuillez utiliser ce formulaire pour fournir des commentaires sur la qualité des réponses du modèle, l’API elle-même ou la qualité de la documentation.L’activation de l’outil de récupération web dans des environnements où Claude traite des entrées non fiables aux côtés de données sensibles pose des risques d’exfiltration de données. Nous recommandons d’utiliser cet outil uniquement dans des environnements de confiance ou lors du traitement de données non sensibles.Pour minimiser les risques d’exfiltration, Claude n’est pas autorisé à construire dynamiquement des URL. Claude ne peut récupérer que les URL qui ont été explicitement fournies par l’utilisateur ou qui proviennent de résultats de recherche web ou de récupération web précédents. Cependant, il existe toujours un risque résiduel qui doit être soigneusement considéré lors de l’utilisation de cet outil.Si l’exfiltration de données est une préoccupation, considérez :
- Désactiver complètement l’outil de récupération web
- Utiliser le paramètre
max_usespour limiter le nombre de demandes - Utiliser le paramètre
allowed_domainspour restreindre aux domaines connus sûrs
Modèles supportés
La récupération web est disponible sur :- Claude Sonnet 4.5 (
claude-sonnet-4-5-20250929) - Claude Sonnet 4 (
claude-sonnet-4-20250514) - Claude Sonnet 3.7 (déprécié) (
claude-3-7-sonnet-20250219) - Claude Haiku 4.5 (
claude-haiku-4-5-20251001) - Claude Haiku 3.5 (
claude-3-5-haiku-latest) - Claude Opus 4.1 (
claude-opus-4-1-20250805) - Claude Opus 4 (
claude-opus-4-20250514)
Comment fonctionne la récupération web
Lorsque vous ajoutez l’outil de récupération web à votre demande d’API :- Claude décide quand récupérer le contenu en fonction de l’invite et des URL disponibles.
- L’API récupère le contenu texte complet de l’URL spécifiée.
- Pour les PDF, l’extraction de texte automatique est effectuée.
- Claude analyse le contenu récupéré et fournit une réponse avec des citations optionnelles.
L’outil de récupération web ne supporte actuellement pas les sites web rendus dynamiquement via Javascript.
Comment utiliser la récupération web
Fournissez l’outil de récupération web dans votre demande d’API :Définition de l’outil
L’outil de récupération web supporte les paramètres suivants :JSON
Utilisations maximales
Le paramètremax_uses limite le nombre de récupérations web effectuées. Si Claude tente plus de récupérations que permis, le web_fetch_tool_result sera une erreur avec le code d’erreur max_uses_exceeded. Il n’y a actuellement pas de limite par défaut.
Filtrage des domaines
Lors de l’utilisation de filtres de domaine :- Les domaines ne doivent pas inclure le schéma HTTP/HTTPS (utilisez
example.comau lieu dehttps://example.com) - Les sous-domaines sont automatiquement inclus (
example.comcouvredocs.example.com) - Les sous-chemins sont supportés (
example.com/blog) - Vous pouvez utiliser soit
allowed_domainssoitblocked_domains, mais pas les deux dans la même demande.
Soyez conscient que les caractères Unicode dans les noms de domaine peuvent créer des vulnérabilités de sécurité par le biais d’attaques par homographe, où des caractères visuellement similaires provenant de différents scripts peuvent contourner les filtres de domaine. Par exemple,
аmazon.com (utilisant le ‘а’ cyrillique) peut sembler identique à amazon.com mais représente un domaine différent.Lors de la configuration des listes d’autorisation/blocage de domaines :- Utilisez des noms de domaine ASCII uniquement si possible
- Considérez que les analyseurs d’URL peuvent gérer la normalisation Unicode différemment
- Testez vos filtres de domaine avec des variations d’homographe potentielles
- Auditez régulièrement vos configurations de domaine pour les caractères Unicode suspects
Limites de contenu
Le paramètremax_content_tokens limite la quantité de contenu qui sera incluse dans le contexte. Si le contenu récupéré dépasse cette limite, il sera tronqué. Cela aide à contrôler l’utilisation des jetons lors de la récupération de documents volumineux.
La limite du paramètre
max_content_tokens est approximative. Le nombre réel de jetons d’entrée utilisés peut varier légèrement.Citations
Contrairement à la recherche web où les citations sont toujours activées, les citations sont optionnelles pour la récupération web. Définissez"citations": {"enabled": true} pour permettre à Claude de citer des passages spécifiques des documents récupérés.
Lors de l’affichage des résultats de l’API directement aux utilisateurs finaux, les citations doivent être incluses à la source originale. Si vous apportez des modifications aux résultats de l’API, notamment en les retraitant et/ou en les combinant avec votre propre matériel avant de les afficher aux utilisateurs finaux, affichez les citations comme approprié en fonction de la consultation avec votre équipe juridique.
Réponse
Voici un exemple de structure de réponse :Résultats de récupération
Les résultats de récupération incluent :url: L’URL qui a été récupéréecontent: Un bloc de document contenant le contenu récupéréretrieved_at: Horodatage du moment où le contenu a été récupéré
L’outil de récupération web met en cache les résultats pour améliorer les performances et réduire les demandes redondantes. Cela signifie que le contenu retourné peut ne pas toujours être la version la plus récente disponible à l’URL. Le comportement du cache est géré automatiquement et peut changer au fil du temps pour optimiser les différents types de contenu et les modèles d’utilisation.
Erreurs
Lorsque l’outil de récupération web rencontre une erreur, l’API Claude retourne une réponse 200 (succès) avec l’erreur représentée dans le corps de la réponse :invalid_input: Format d’URL invalideurl_too_long: L’URL dépasse la longueur maximale (250 caractères)url_not_allowed: URL bloquée par les règles de filtrage de domaine et les restrictions du modèleurl_not_accessible: Échec de la récupération du contenu (erreur HTTP)too_many_requests: Limite de débit dépasséeunsupported_content_type: Type de contenu non supporté (texte et PDF uniquement)max_uses_exceeded: Utilisations maximales de l’outil de récupération web dépasséesunavailable: Une erreur interne s’est produite
Validation d’URL
Pour des raisons de sécurité, l’outil de récupération web ne peut récupérer que les URL qui ont précédemment apparu dans le contexte de la conversation. Cela inclut :- Les URL dans les messages utilisateur
- Les URL dans les résultats d’outils côté client
- Les URL provenant de résultats de recherche web ou de récupération web précédents
Recherche et récupération combinées
La récupération web fonctionne de manière transparente avec la recherche web pour une collecte d’informations complète :- Utiliser la recherche web pour trouver des articles pertinents
- Sélectionner les résultats les plus prometteurs
- Utiliser la récupération web pour récupérer le contenu complet
- Fournir une analyse détaillée avec des citations
Mise en cache des invites
La récupération web fonctionne avec la mise en cache des invites. Pour activer la mise en cache des invites, ajoutez des points d’arrêtcache_control dans votre demande. Les résultats de récupération mis en cache peuvent être réutilisés entre les tours de conversation.
Diffusion en continu
Avec la diffusion en continu activée, les événements de récupération font partie du flux avec une pause pendant la récupération du contenu :Demandes par lot
Vous pouvez inclure l’outil de récupération web dans l’API Messages Batches. Les appels d’outil de récupération web via l’API Messages Batches sont facturés de la même manière que ceux dans les demandes d’API Messages régulières.Utilisation et tarification
Web fetch usage has no additional charges beyond standard token costs:max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
- Average web page (10KB): ~2,500 tokens
- Large documentation page (100KB): ~25,000 tokens
- Research paper PDF (500KB): ~125,000 tokens