Инструмент веб-выборки в настоящее время находится в бета-версии. Чтобы включить его, используйте заголовок бета-версии
web-fetch-2025-09-10 в ваших запросах API.Пожалуйста, используйте эту форму для предоставления отзывов о качестве ответов модели, самом API или качестве документации.Включение инструмента веб-выборки в окружениях, где Claude обрабатывает ненадежные входные данные вместе с конфиденциальными данными, создает риски утечки данных. Мы рекомендуем использовать этот инструмент только в надежных окружениях или при работе с неконфиденциальными данными.Чтобы минимизировать риски утечки, Claude не может динамически конструировать URL-адреса. Claude может получать только URL-адреса, которые были явно предоставлены пользователем или которые поступают из предыдущих результатов веб-поиска или веб-выборки. Однако остается остаточный риск, который следует тщательно учитывать при использовании этого инструмента.Если утечка данных вызывает беспокойство, рассмотрите:
- Полное отключение инструмента веб-выборки
- Использование параметра
max_usesдля ограничения количества запросов - Использование параметра
allowed_domainsдля ограничения известными безопасными доменами
Поддерживаемые модели
Веб-выборка доступна на:- Claude Sonnet 4.5 (
claude-sonnet-4-5-20250929) - Claude Sonnet 4 (
claude-sonnet-4-20250514) - Claude Sonnet 3.7 (устарело) (
claude-3-7-sonnet-20250219) - Claude Haiku 4.5 (
claude-haiku-4-5-20251001) - Claude Haiku 3.5 (
claude-3-5-haiku-latest) - Claude Opus 4.1 (
claude-opus-4-1-20250805) - Claude Opus 4 (
claude-opus-4-20250514)
Как работает веб-выборка
Когда вы добавляете инструмент веб-выборки в ваш запрос API:- Claude решает, когда получить содержимое на основе подсказки и доступных URL-адресов.
- API получает полное текстовое содержимое с указанного URL-адреса.
- Для PDF-файлов выполняется автоматическое извлечение текста.
- Claude анализирует полученное содержимое и предоставляет ответ с необязательными цитатами.
Инструмент веб-выборки в настоящее время не поддерживает веб-сайты, динамически отображаемые через Javascript.
Как использовать веб-выборку
Предоставьте инструмент веб-выборки в вашем запросе API:Определение инструмента
Инструмент веб-выборки поддерживает следующие параметры:JSON
Максимальное использование
Параметрmax_uses ограничивает количество выполняемых веб-выборок. Если Claude попытается выполнить больше выборок, чем разрешено, web_fetch_tool_result будет ошибкой с кодом ошибки max_uses_exceeded. В настоящее время нет ограничения по умолчанию.
Фильтрация доменов
При использовании фильтров доменов:- Домены не должны включать схему HTTP/HTTPS (используйте
example.comвместоhttps://example.com) - Поддомены автоматически включены (
example.comохватываетdocs.example.com) - Поддерживаются подпути (
example.com/blog) - Вы можете использовать либо
allowed_domains, либоblocked_domains, но не оба в одном запросе.
Имейте в виду, что символы Unicode в названиях доменов могут создавать уязвимости безопасности через атаки омографов, когда визуально похожие символы из разных скриптов могут обойти фильтры доменов. Например,
аmazon.com (с использованием кириллицы ‘а’) может выглядеть идентично amazon.com, но представляет другой домен.При настройке списков разрешений/блокировок доменов:- Используйте только ASCII-домены, когда это возможно
- Учитывайте, что парсеры URL могут обрабатывать нормализацию Unicode по-разному
- Протестируйте фильтры доменов с потенциальными вариантами омографов
- Регулярно проверяйте конфигурации доменов на предмет подозрительных символов Unicode
Ограничения содержимого
Параметрmax_content_tokens ограничивает объем содержимого, которое будет включено в контекст. Если полученное содержимое превышает это ограничение, оно будет усечено. Это помогает контролировать использование токенов при выборке больших документов.
Ограничение параметра
max_content_tokens является приблизительным. Фактическое количество использованных входных токенов может немного варьироваться.Цитаты
В отличие от веб-поиска, где цитаты всегда включены, цитаты являются необязательными для веб-выборки. Установите"citations": {"enabled": true} для включения возможности Claude цитировать конкретные отрывки из полученных документов.
При прямом отображении выходных данных API конечным пользователям цитаты должны быть включены в исходный источник. Если вы вносите изменения в выходные данные API, включая переработку и/или объединение их с вашим собственным материалом перед отображением конечным пользователям, отображайте цитаты надлежащим образом на основе консультации с вашей юридической командой.
Ответ
Вот пример структуры ответа:Результаты выборки
Результаты выборки включают:url: URL-адрес, который был полученcontent: Блок документа, содержащий полученное содержимоеretrieved_at: Временная метка, когда содержимое было получено
Инструмент веб-выборки кэширует результаты для повышения производительности и снижения избыточных запросов. Это означает, что возвращаемое содержимое может быть не всегда последней версией, доступной по URL-адресу. Поведение кэша управляется автоматически и может изменяться со временем для оптимизации различных типов содержимого и моделей использования.
Ошибки
Когда инструмент веб-выборки встречает ошибку, Claude API возвращает ответ 200 (успех) с ошибкой, представленной в теле ответа:invalid_input: Неверный формат URLurl_too_long: URL превышает максимальную длину (250 символов)url_not_allowed: URL заблокирован правилами фильтрации доменов и ограничениями моделиurl_not_accessible: Не удалось получить содержимое (ошибка HTTP)too_many_requests: Превышен лимит частоты запросовunsupported_content_type: Тип содержимого не поддерживается (только текст и PDF)max_uses_exceeded: Превышено максимальное использование инструмента веб-выборкиunavailable: Произошла внутренняя ошибка
Проверка URL
По соображениям безопасности инструмент веб-выборки может получать только URL-адреса, которые ранее появились в контексте беседы. Это включает:- URL-адреса в сообщениях пользователя
- URL-адреса в результатах инструментов на стороне клиента
- URL-адреса из предыдущих результатов веб-поиска или веб-выборки
Комбинированный поиск и выборка
Веб-выборка работает бесперебойно с веб-поиском для комплексного сбора информации:- Использовать веб-поиск для поиска релевантных статей
- Выбрать наиболее перспективные результаты
- Использовать веб-выборку для получения полного содержимого
- Предоставить подробный анализ с цитатами
Кэширование подсказок
Веб-выборка работает с кэшированием подсказок. Чтобы включить кэширование подсказок, добавьте точки разрываcache_control в ваш запрос. Кэшированные результаты выборки могут быть повторно использованы в разных ходах беседы.
Потоковая передача
При включенной потоковой передаче события выборки являются частью потока с паузой во время получения содержимого:Пакетные запросы
Вы можете включить инструмент веб-выборки в Messages Batches API. Вызовы инструмента веб-выборки через Messages Batches API оцениваются так же, как в обычных запросах Messages API.Использование и ценообразование
Web fetch usage has no additional charges beyond standard token costs:max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
- Average web page (10KB): ~2,500 tokens
- Large documentation page (100KB): ~25,000 tokens
- Research paper PDF (500KB): ~125,000 tokens