Claude Sonnet 5: quando l’AI agente diventa accessibile (e costa meno)

Anthropic ha lanciato Claude Sonnet 5, e la promessa è chiara: prestazioni da modello Opus, ma con un prezzo da Sonnet. Tradotto? Quello che fino a pochi mesi fa richiedeva i modelli più grossi e costosi — pianificazione, uso autonomo di browser e terminali, coding complesso — ora lo fa un modello di fascia media.

Sonnet 5 chiude il gap. Le sue performance si avvicinano a quelle di Opus 4.8, ma costa meno. Molto meno.

I numeri parlano chiaro (per una volta)

Rispetto al predecessore Sonnet 4.6, i miglioramenti toccano tutto quello che conta quando parliamo di AI agenti: ragionamento, uso di tool, coding, knowledge work. I grafici di confronto mostrano che Sonnet 5 non solo batte nettamente il 4.6, ma in certi task raggiunge le prestazioni di Opus 4.8. Che costa il doppio.

Il pricing di lancio? Due dollari per milione di token in input, dieci per l’output. Fino al 31 agosto 2026, poi sale a 3 e 15 dollari rispettivamente. Opus 4.8, per dire, parte da 5 e 25. Fate voi i conti.

Cosa significa ‘più agente’

I feedback dei partner di test sono stati unanimi: Sonnet 5 completa task complessi dove i predecessori si fermavano a metà. Controlla il proprio output senza che glielo si chieda esplicitamente. E lo fa a un prezzo che ha senso per produzioni reali.

‘Claude Sonnet 5 ci ha portato a termine un lavoro in due parti — aggiornare i tier degli account Salesforce e inviare un annuncio di lancio ai contatti enterprise — dall’inizio alla fine. Prima si bloccava a metà strada’ dice uno dei tester. Un altro ha raccontato di avergli chiesto di investigare un bug: ‘Senza prompt, ha scritto un test per riprodurlo, implementato il fix, poi l’ha nascosto per confermare che il bug tornasse senza la modifica. Tutto in un unico passaggio’.

Sicurezza: meno pericoloso del 4.6, ma non è Opus

Le valutazioni pre-deployment mostrano che Sonnet 5 è complessivamente più sicuro del 4.6. Rifiuta meglio le richieste malevole, resiste meglio agli attacchi di prompt injection. Tassi più bassi di allucinazioni e comportamenti sycophantic — quella fastidiosa tendenza a dire sempre di sì.

Ma c’è un però. Anthropic non ha deliberatamente addestrato Sonnet 5 su task di cybersecurity. Risultato? Sa fare operazioni cyber di routine e non pericolose, ma sulle skill veramente rischiose — tipo sviluppare exploit software — va molto peggio di Opus 4.8 o Mythos 5.

I test su vulnerabilità di Firefox 147 sono eloquenti: né Sonnet 4.6 né Sonnet 5 sono riusciti a sviluppare un exploit funzionante (0.0% di successo). Il 5 ha mostrato un tasso leggermente più alto di successo parziale, probabilmente per via del miglioramento generale di intelligenza, non per training specifico.

Safeguard attivi di default

Dato che Sonnet 5 è comunque un po’ più forte del predecessore su questi compiti, Anthropic l’ha lanciato con safeguard cyber attivi di default. Gli stessi presenti in Opus 4.7 e 4.8 — che rilevano e bloccano in tempo reale usi cyber pericolosi. Meno stringenti di quelli di Fable 5, perché il livello complessivo di rischio è stato giudicato basso.

Dove lo trovi e quanto costa davvero

Disponibile da oggi su tutti i piani: è il modello di default per Free e Pro, accessibile anche su Max, Team ed Enterprise. Lo trovi in Claude Code e sulla Claude Platform, richiamabile via API come claude-sonnet-5.

Il pricing introduttivo (2 dollari input, 10 output per milione di token) dura fino al 31 agosto 2026. Poi passa a 3 e 15. Anthropic ha alzato i rate limit su Chat, Cowork, Claude Code e Platform per accomodare l’uso più intenso di token ai livelli di effort più alti. Puoi scegliere il livello che ha senso per il tuo progetto specifico.

Il tokenizer è cambiato

Dettaglio tecnico che incide sul portafoglio: Sonnet 5 usa un tokenizer aggiornato che migliora le performance, ma significa che lo stesso input può mappare su più token. Fattore di moltiplicazione: circa 1.0–1.35x a seconda del tipo di contenuto. Il pricing introduttivo è stato calibrato per rendere la transizione da Sonnet 4.6 sostanzialmente cost-neutral. Almeno questo.

I grafici di cost-performance mostrano che Sonnet 5 copre una gamma di opzioni molto più ampia di Sonnet 4.6, e in alcuni casi eguaglia Opus 4.8. Tra Sonnet 5 e Opus 4.8, puoi regolare il livello di effort per trovare il bilanciamento giusto tra costo e prestazioni. Che è esattamente quello che serve quando l’AI agente passa dal proof of concept alla produzione.