Come utilizzare la visione
Utilizza le capacità di visione di Claude tramite:- claude.ai. Carica un’immagine come faresti con un file, oppure trascina e rilascia un’immagine direttamente nella finestra della chat.
- Console Workbench. Se selezioni un modello che accetta immagini (solo modelli Claude 3 e 4), un pulsante per aggiungere immagini appare in alto a destra di ogni blocco di messaggio dell’utente.
- Richiesta API. Vedi gli esempi in questa guida.
Prima di caricare
Nozioni di base e limiti
Puoi includere più immagini in una singola richiesta (fino a 20 per claude.ai e 100 per richieste API). Claude analizzerà tutte le immagini fornite quando formula la sua risposta. Questo può essere utile per confrontare o contrastare le immagini. Se invii un’immagine più grande di 8000x8000 px, verrà rifiutata. Se invii più di 20 immagini in una richiesta API, questo limite è 2000x2000 px.Valuta la dimensione dell’immagine
Per prestazioni ottimali, consigliamo di ridimensionare le immagini prima di caricarle se sono troppo grandi. Se il bordo lungo della tua immagine è superiore a 1568 pixel, o la tua immagine è superiore a ~1.600 token, verrà prima ridimensionata, preservando le proporzioni, finché non rientra nei limiti di dimensione. Se la tua immagine di input è troppo grande e deve essere ridimensionata, aumenterà la latenza del time-to-first-token, senza darti alcuna prestazione aggiuntiva del modello. Le immagini molto piccole sotto i 200 pixel su qualsiasi bordo possono degradare le prestazioni.| Rapporto di aspetto | Dimensione immagine |
|---|---|
| 1:1 | 1092x1092 px |
| 3:4 | 951x1268 px |
| 2:3 | 896x1344 px |
| 9:16 | 819x1456 px |
| 1:2 | 784x1568 px |
Calcola i costi delle immagini
Ogni immagine che includi in una richiesta a Claude conta verso il tuo utilizzo di token. Per calcolare il costo approssimativo, moltiplica il numero approssimativo di token dell’immagine per il prezzo per token del modello che stai utilizzando. Se la tua immagine non ha bisogno di essere ridimensionata, puoi stimare il numero di token utilizzati attraverso questo algoritmo:token = (larghezza px * altezza px)/750
Ecco esempi di tokenizzazione approssimativa e costi per diverse dimensioni di immagini entro i vincoli di dimensione dell’API basati sul prezzo per token di Claude Sonnet 3.7 di $3 per milione di token di input:
| Dimensione immagine | N. di token | Costo / immagine | Costo / 1K immagini |
|---|---|---|---|
| 200x200 px(0,04 megapixel) | ~54 | ~$0,00016 | ~$0,16 |
| 1000x1000 px(1 megapixel) | ~1334 | ~$0,004 | ~$4,00 |
| 1092x1092 px(1,19 megapixel) | ~1590 | ~$0,0048 | ~$4,80 |
Garantire la qualità dell’immagine
Quando fornisci immagini a Claude, tieni presente quanto segue per i migliori risultati:- Formato immagine: Utilizza un formato di immagine supportato: JPEG, PNG, GIF o WebP.
- Chiarezza immagine: Assicurati che le immagini siano chiare e non troppo sfocate o pixelate.
- Testo: Se l’immagine contiene testo importante, assicurati che sia leggibile e non troppo piccolo. Evita di ritagliare il contesto visivo chiave solo per ingrandire il testo.
Esempi di prompt
Molte delle tecniche di prompt che funzionano bene per le interazioni basate su testo con Claude possono essere applicate anche ai prompt basati su immagini. Questi esempi dimostrano le migliori strutture di prompt che coinvolgono immagini.Informazioni sugli esempi di prompt
I seguenti esempi dimostrano come utilizzare le capacità di visione di Claude utilizzando vari linguaggi di programmazione e approcci. Puoi fornire immagini a Claude in tre modi:- Come immagine codificata in base64 nei blocchi di contenuto
image - Come riferimento URL a un’immagine ospitata online
- Utilizzando l’API Files (carica una volta, utilizza più volte)
Esempio di immagine codificata in base64
Esempio di immagine basata su URL
Esempio di immagine dell’API Files
Per le immagini che utilizzerai ripetutamente o quando vuoi evitare il sovraccarico di codifica, utilizza l’API Files:Esempio: Un'immagine
Esempio: Un'immagine
| Ruolo | Contenuto |
|---|---|
| Utente | [Immagine] Descrivi questa immagine. |
Esempio: Più immagini
Esempio: Più immagini
Immagine 1: e Immagine 2: e così via. Non hai bisogno di interruzioni di riga tra le immagini o tra le immagini e il prompt.Chiedi a Claude di descrivere le differenze tra più immagini.| Ruolo | Contenuto |
|---|---|
| Utente | Immagine 1: [Immagine 1] Immagine 2: [Immagine 2] Come sono diverse queste immagini? |
Esempio: Più immagini con un prompt di sistema
Esempio: Più immagini con un prompt di sistema
| Contenuto | |
|---|---|
| Sistema | Rispondi solo in spagnolo. |
| Utente | Immagine 1: [Immagine 1] Immagine 2: [Immagine 2] Come sono diverse queste immagini? |
Esempio: Quattro immagini in due turni di conversazione
Esempio: Quattro immagini in due turni di conversazione
| Ruolo | Contenuto |
|---|---|
| Utente | Immagine 1: [Immagine 1] Immagine 2: [Immagine 2] Come sono diverse queste immagini? |
| Assistente | [Risposta di Claude] |
| Utente | Immagine 1: [Immagine 3] Immagine 2: [Immagine 4] Queste immagini sono simili alle prime due? |
| Assistente | [Risposta di Claude] |
user come parte di qualsiasi struttura standard di conversazione multiturn.Limitazioni
Sebbene le capacità di comprensione delle immagini di Claude siano all’avanguardia, ci sono alcune limitazioni di cui essere consapevoli:- Identificazione di persone: Claude non può essere utilizzato per identificare (cioè nominare) persone nelle immagini e rifiuterà di farlo.
- Precisione: Claude può allucinare o fare errori quando interpreta immagini di bassa qualità, ruotate o molto piccole sotto i 200 pixel.
- Ragionamento spaziale: Le capacità di ragionamento spaziale di Claude sono limitate. Potrebbe avere difficoltà con compiti che richiedono una localizzazione precisa o layout, come leggere il volto di un orologio analogico o descrivere le posizioni esatte dei pezzi degli scacchi.
- Conteggio: Claude può dare conteggi approssimativi di oggetti in un’immagine ma potrebbe non essere sempre precisamente accurato, specialmente con grandi numeri di piccoli oggetti.
- Immagini generate da IA: Claude non sa se un’immagine è generata da IA e potrebbe essere scorretto se chiesto. Non fare affidamento su di esso per rilevare immagini false o sintetiche.
- Contenuto inappropriato: Claude non elaborerà immagini inappropriate o esplicite che violano la nostra Politica di utilizzo accettabile.
- Applicazioni sanitarie: Sebbene Claude possa analizzare immagini mediche generali, non è progettato per interpretare scansioni diagnostiche complesse come TC o risonanze magnetiche. Gli output di Claude non devono essere considerati un sostituto della consulenza medica professionale o della diagnosi.
Domande frequenti
Quali tipi di file di immagine supporta Claude?
Quali tipi di file di immagine supporta Claude?
image/jpegimage/pngimage/gifimage/webp
Claude può leggere gli URL delle immagini?
Claude può leggere gli URL delle immagini?
C'è un limite alla dimensione del file di immagine che posso caricare?
C'è un limite alla dimensione del file di immagine che posso caricare?
- API: Massimo 5MB per immagine
- claude.ai: Massimo 10MB per immagine
Quante immagini posso includere in una richiesta?
Quante immagini posso includere in una richiesta?
- API Messages: Fino a 100 immagini per richiesta
- claude.ai: Fino a 20 immagini per turno
Claude legge i metadati dell'immagine?
Claude legge i metadati dell'immagine?
Posso eliminare le immagini che ho caricato?
Posso eliminare le immagini che ho caricato?
Dove posso trovare i dettagli sulla privacy dei dati per i caricamenti di immagini?
Dove posso trovare i dettagli sulla privacy dei dati per i caricamenti di immagini?
E se l'interpretazione dell'immagine di Claude sembra sbagliata?
E se l'interpretazione dell'immagine di Claude sembra sbagliata?
- Assicurati che l’immagine sia chiara, di alta qualità e correttamente orientata.
- Prova le tecniche di prompt engineering per migliorare i risultati.
- Se il problema persiste, contrassegna l’output in claude.ai (pollice su/giù) o contatta il nostro team di supporto.
Claude può generare o modificare immagini?
Claude può generare o modificare immagini?
Approfondisci la visione
Pronto a iniziare a costruire con immagini utilizzando Claude? Ecco alcune risorse utili:- Multimodal cookbook: Questo cookbook ha suggerimenti su come iniziare con le immagini e tecniche di migliore pratica per garantire le migliori prestazioni con le immagini. Vedi come puoi prompt efficacemente Claude con immagini per eseguire compiti come interpretare e analizzare grafici o estrarre contenuto da moduli.
- Riferimento API: Visita la nostra documentazione per l’API Messages, inclusi esempi di chiamate API che coinvolgono immagini.