提供されたPDF内のテキスト、画像、チャート、表について、Claudeに質問できるようになりました。使用例の一部:
  • 財務レポートの分析とチャート/表の理解
  • 法的文書からの重要情報の抽出
  • 文書の翻訳支援
  • 文書情報の構造化フォーマットへの変換

始める前に

PDF要件の確認

Claudeは標準的なPDFで動作します。ただし、PDFサポートを使用する際は、リクエストサイズが以下の要件を満たしていることを確認してください:
要件制限
最大リクエストサイズ32MB
リクエストあたりの最大ページ数100
フォーマット標準PDF(パスワード/暗号化なし)
両方の制限は、PDFと一緒に送信される他のコンテンツを含む、リクエストペイロード全体に適用されることにご注意ください。 PDFサポートはClaudeのビジョン機能に依存しているため、他のビジョンタスクと同じ制限と考慮事項が適用されます。

サポートされているプラットフォームとモデル

PDFサポートは現在、直接API アクセスとGoogle Vertex AIを通じてサポートされています。すべてのアクティブモデルがPDF処理をサポートしています。 PDFサポートは以下の考慮事項とともに、Amazon Bedrockで利用可能になりました:

Amazon Bedrock PDFサポート

Amazon BedrockのConverse APIを通じてPDFサポートを使用する場合、2つの異なるドキュメント処理モードがあります:
重要: Converse APIでClaudeの完全な視覚的PDF理解機能にアクセスするには、引用を有効にする必要があります。引用を有効にしないと、APIは基本的なテキスト抽出のみにフォールバックします。引用の使用について詳しく学んでください。

ドキュメント処理モード

  1. Converse Document Chat(元のモード - テキスト抽出のみ)
    • PDFからの基本的なテキスト抽出を提供
    • PDF内の画像、チャート、視覚的レイアウトを分析できません
    • 3ページのPDFで約1,000トークンを使用
    • 引用が有効でない場合に自動的に使用されます
  2. Claude PDF Chat(新しいモード - 完全な視覚的理解)
    • PDFの完全な視覚的分析を提供
    • チャート、グラフ、画像、視覚的レイアウトを理解・分析できます
    • 包括的な理解のために各ページをテキストと画像の両方として処理
    • 3ページのPDFで約7,000トークンを使用
    • Converse APIで引用を有効にする必要があります

主な制限

  • Converse API: 視覚的PDF分析には引用を有効にする必要があります。現在、引用なしで視覚的分析を使用するオプションはありません(InvokeModel APIとは異なります)。
  • InvokeModel API: 強制的な引用なしでPDF処理を完全に制御できます。

よくある問題

Converse APIを使用している際に、顧客がClaudeがPDF内の画像やチャートを見ていないと報告する場合、引用フラグを有効にする必要がある可能性があります。引用フラグがないと、Converseは基本的なテキスト抽出のみにフォールバックします。
これはConverse APIの既知の制約であり、対処に取り組んでいます。引用なしで視覚的PDF分析が必要なアプリケーションの場合は、代わりにInvokeModel APIの使用を検討してください。
.csv、.xlsx、.docx、.md、.txtファイルなどのPDF以外のファイルについては、他のファイル形式の使用をご覧ください。

ClaudeでPDFを処理する

最初のPDFリクエストを送信する

Messages APIを使用したシンプルな例から始めましょう。Claudeに3つの方法でPDFを提供できます:
  1. オンラインでホストされているPDFへのURL参照として
  2. documentコンテンツブロック内のbase64エンコードされたPDFとして
  3. Files APIからのfile_idによって

オプション1: URLベースのPDFドキュメント

最もシンプルなアプローチは、URLから直接PDFを参照することです:
 curl https://api.anthropic.com/v1/messages \
   -H "content-type: application/json" \
   -H "x-api-key: $ANTHROPIC_API_KEY" \
   -H "anthropic-version: 2023-06-01" \
   -d '{
     "model": "claude-sonnet-4-5",
     "max_tokens": 1024,
     "messages": [{
         "role": "user",
         "content": [{
             "type": "document",
             "source": {
                 "type": "url",
                 "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
             }
         },
         {
             "type": "text",
             "text": "What are the key findings in this document?"
         }]
     }]
 }'

オプション2: Base64エンコードされたPDFドキュメント

ローカルシステムからPDFを送信する必要がある場合や、URLが利用できない場合:
# 方法1: リモートPDFを取得してエンコードする
curl -s "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf" | base64 | tr -d '\n' > pdf_base64.txt

# 方法2: ローカルPDFファイルをエンコードする
# base64 document.pdf | tr -d '\n' > pdf_base64.txt

# pdf_base64.txtの内容を使用してJSONリクエストファイルを作成する
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
    "model": "claude-sonnet-4-5",
    "max_tokens": 1024,
    "messages": [{
        "role": "user",
        "content": [{
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": $PDF_BASE64
            }
        },
        {
            "type": "text",
            "text": "What are the key findings in this document?"
        }]
    }]
}' > request.json

# JSONファイルを使用してAPIリクエストを送信する
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

オプション3: Files API

繰り返し使用するPDFや、エンコーディングのオーバーヘッドを避けたい場合は、Files APIを使用してください:
# まず、PDFをFiles APIにアップロードする
curl -X POST https://api.anthropic.com/v1/files \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -F "[email protected]"

# 次に、返されたfile_idをメッセージで使用する
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -d '{
    "model": "claude-sonnet-4-5", 
    "max_tokens": 1024,
    "messages": [{
      "role": "user",
      "content": [{
        "type": "document",
        "source": {
          "type": "file",
          "file_id": "file_abc123"
        }
      },
      {
        "type": "text",
        "text": "What are the key findings in this document?"
      }]
    }]
  }'

PDFサポートの仕組み

PDFをClaudeに送信すると、以下のステップが実行されます:
1

システムがドキュメントの内容を抽出します。

  • システムはドキュメントの各ページを画像に変換します。
  • 各ページからテキストが抽出され、各ページの画像と一緒に提供されます。
2

Claudeはテキストと画像の両方を分析して、ドキュメントをより良く理解します。

  • ドキュメントは分析のためにテキストと画像の組み合わせとして提供されます。
  • これにより、ユーザーはチャート、図表、その他の非テキストコンテンツなど、PDFの視覚的要素についての洞察を求めることができます。
3

Claudeは関連する場合、PDFの内容を参照して応答します。

Claudeは応答する際に、テキストと視覚的コンテンツの両方を参照できます。以下と統合することで、パフォーマンスをさらに向上させることができます:
  • プロンプトキャッシング: 繰り返し分析のパフォーマンスを向上させるため。
  • バッチ処理: 大量のドキュメント処理のため。
  • ツール使用: ドキュメントから特定の情報を抽出してツール入力として使用するため。

コストを見積もる

PDFファイルのトークン数は、ドキュメントから抽出された総テキストとページ数に依存します:
  • テキストトークンコスト: 各ページは通常、コンテンツ密度に応じて1ページあたり1,500-3,000トークンを使用します。標準API価格が適用され、追加のPDF料金はありません。
  • 画像トークンコスト: 各ページが画像に変換されるため、同じ画像ベースのコスト計算が適用されます。
トークンカウントを使用して、特定のPDFのコストを見積もることができます。

PDF処理を最適化する

パフォーマンスを向上させる

最適な結果を得るために、以下のベストプラクティスに従ってください:
  • リクエストでテキストの前にPDFを配置する
  • 標準フォントを使用する
  • テキストが明確で読みやすいことを確認する
  • ページを適切な正立方向に回転させる
  • プロンプトで論理的なページ番号(PDFビューアーから)を使用する
  • 必要に応じて大きなPDFをチャンクに分割する
  • 繰り返し分析のためにプロンプトキャッシングを有効にする

実装をスケールする

大量処理の場合、以下のアプローチを検討してください:

プロンプトキャッシングを使用する

繰り返しクエリのパフォーマンスを向上させるためにPDFをキャッシュする:
# pdf_base64.txtの内容を使用してJSONリクエストファイルを作成する
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
    "model": "claude-sonnet-4-5",
    "max_tokens": 1024,
    "messages": [{
        "role": "user",
        "content": [{
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": $PDF_BASE64
            },
            "cache_control": {
              "type": "ephemeral"
            }
        },
        {
            "type": "text",
            "text": "Which model has the highest human preference win rates across each use-case?"
        }]
    }]
}' > request.json

# 次にJSONファイルを使用してAPI呼び出しを行う
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

ドキュメントバッチを処理する

大量ワークフローにはMessage Batches APIを使用する:
# pdf_base64.txtの内容を使用してJSONリクエストファイルを作成する
jq -n --rawfile PDF_BASE64 pdf_base64.txt '
{
  "requests": [
      {
          "custom_id": "my-first-request",
          "params": {
              "model": "claude-sonnet-4-5",
              "max_tokens": 1024,
              "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "document",
                            "source": {
 "type": "base64",
 "media_type": "application/pdf",
 "data": $PDF_BASE64
                            }
                        },
                        {
                            "type": "text",
                            "text": "Which model has the highest human preference win rates across each use-case?"
                        }
                    ]
                }
              ]
          }
      },
      {
          "custom_id": "my-second-request",
          "params": {
              "model": "claude-sonnet-4-5",
              "max_tokens": 1024,
              "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "document",
                            "source": {
 "type": "base64",
 "media_type": "application/pdf",
 "data": $PDF_BASE64
                            }
                        },
                        {
                            "type": "text",
                            "text": "Extract 5 key insights from this document."
                        }
                    ]
                }
              ]
          }
      }
  ]
}
' > request.json

# 次にJSONファイルを使用してAPI呼び出しを行う
curl https://api.anthropic.com/v1/messages/batches \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

次のステップ