OpenAI lancia GPT-5.6 Sol: più potente, più controllato, ma non per tutti (ancora)

OpenAI ha iniziato l’anteprima limitata della serie GPT-5.6: Sol, il modello flagship; Terra, bilanciato per il lavoro quotidiano; e Luna, veloce ed economico. Terra offre prestazioni competitive con GPT-5.5 costando la metà, mentre Luna porta capacità solide al prezzo più basso di sempre.

Ma c’è un dettaglio non da poco. L’anteprima è limitata. Pochissimi partner selezionati, e — sorpresa — il governo USA ha avuto accesso preventivo. OpenAI è stata chiara: ‘Non crediamo che questo tipo di processo di accesso governativo debba diventare lo standard a lungo termine. Tiene i migliori strumenti lontani da utenti, sviluppatori, imprese, difensori cyber e partner globali che ne hanno bisogno.’ Però sì, per ora funziona così. Un passo temporaneo, dicono, per arrivare a una disponibilità più ampia nelle prossime settimane.

Le capacità che fanno girare la testa

GPT-5.6 Sol è il modello più potente mai rilasciato da OpenAI. E i numeri lo dimostrano. Su TerminalBench 2.1 — che testa flussi di lavoro da linea di comando con pianificazione, iterazione e coordinamento degli strumenti — Sol Ultra raggiunge il 91,9%. Sopra Claude Mythos 5 (84,3%) e nettamente sopra GPT-5.5 (88%).

Introducono anche due novità: max reasoning effort, che dà a Sol il massimo tempo per ragionare in profondità, e ultra mode, che va oltre un singolo agente usando sotto-agenti per accelerare lavori complessi. Tradotto: il modello può delegare parti del lavoro a se stesso per andare più veloce su task articolati.

In biologia, su GeneBench v1 (analisi genomiche e quantitative a lungo orizzonte), Sol supera GPT-5.5 usando meno token. Meno costi, più risultati. La direzione giusta.

Cybersecurity: più capace, più pericoloso, più protetto

Qui le cose si fanno interessanti. GPT-5.6 Sol è il modello più capace mai rilasciato da OpenAI per la cybersecurity. Su ExploitBench, è competitivo con Claude Mythos Preview usando solo un terzo dei token di output. Su ExploitGym — benchmark creato da ricercatori UC Berkeley con OpenAI e altri lab — Sol, Terra e Luna mostrano tutti miglioramenti forti nelle capacità cyber aumentando il reasoning.

Ma — e questo è il punto chiave — Sol è migliore nell’aiutare le persone a trovare e correggere vulnerabilità che nell’eseguire attacchi end-to-end in modo affidabile. Nelle valutazioni su Chromium e Firefox, ha identificato bug e ‘exploitation primitives’ (i mattoni di un exploit), ma non ha prodotto autonomamente un exploit funzionale full-chain nelle condizioni testate.

Non supera la soglia Cyber Critical del Preparedness Framework di OpenAI. Però — e qui OpenAI è onesta — le soglie dei benchmark non possono catturare ogni modo in cui un modello può essere usato o combinato con altri strumenti. Quella incertezza, insieme al salto di capacità del modello, è il motivo per cui stanno accoppiando le maggiori capacità con salvaguardie più forti e un rilascio graduale.

Un sistema di protezione a strati

Nessuna singola protezione basta contro un uso improprio determinato o adattivo. OpenAI usa salvaguardie stratificate, con configurazioni esatte che variano tra i modelli, e le testa sotto pressione per attacchi reali. Queste includono:

Protezioni integrate nel modello. GPT-5.6 è addestrato a rifiutare assistenza cyber proibita, anche quando gli utenti tentano di mascherare le intenzioni o fare jailbreak.

Classificatori real-time per abusi cyber e biologici che valutano l’output mentre viene generato. Nei casi ad alto rischio, se rilevano una potenziale violazione, la generazione può essere messa in pausa mentre un modello di reasoning più grande rivede la conversazione e il contesto. Se l’output è considerato non consentito, viene bloccato prima di raggiungere l’utente.

Attività segnalate possono anche innescare una revisione a livello di account su conversazioni rilevanti e segnali di rischio. Guardare oltre una singola conversazione aiuta i sistemi a distinguere comportamenti malevoli persistenti da lavoro di sicurezza legittimo dual-use, dove concetti tecnici simili possono apparire in contesti molto diversi.

Insieme, questi strati rendono l’approccio complessivo più robusto di qualsiasi singola salvaguardia. OpenAI è chiara: durante l’anteprima, gli utenti potrebbero incontrare salvaguardie che bloccano o rifiutano alcune richieste. Altre potrebbero richiedere più tempo perché la generazione viene messa in pausa per revisione aggiuntiva. Le salvaguardie potrebbero occasionalmente intervenire su lavoro legittimo, particolarmente in aree dual-use dove attività difensive e offensive possono inizialmente sembrare simili.

È parte di ciò che l’anteprima è progettata per testare. Vogliono capire non solo se le salvaguardie limitano l’abuso, ma se gli utenti legittimi possono ancora completare il lavoro normale in modo affidabile ed efficiente.

Red-teaming automatizzato: 700.000 ore GPU per trovare debolezze

Le salvaguardie devono anche rimanere efficaci quando gli attaccanti adattano le tattiche. Una protezione che funziona solo su un insieme fisso di attacchi noti non è abbastanza robusta per un modello frontier.

Per questo OpenAI sta applicando più intelligenza e compute che mai alla sicurezza, usando i propri modelli per trovare debolezze e migliorare le salvaguardie più velocemente. Hanno dedicato oltre 700.000 ore GPU equivalenti A100 al red teaming automatizzato mirato a trovare jailbreak universali: attacchi che possono funzionare su molti prompt o contesti, non solo un’impostazione ristretta.

Concentrarsi su questi attacchi più difficili e generali permette di testare le salvaguardie oltre un insieme fisso di fallimenti noti. Permette anche di esplorare molti più pattern di attacco di quanto il solo testing umano potrebbe coprire, identificare pattern di fallimento prima e accorciare il percorso dal trovare una debolezza all’affrontarla.

Oltre al red-teaming automatizzato, hanno lavorato con tester terzi per condurre red teaming umano esperto estensivo, che continuerà nel periodo di anteprima. Il red-teaming umano complementa il lavoro automatizzato testando le salvaguardie contro esperti creativi che cercano di abusare del modello in modi che i sistemi potrebbero non anticipare.

Disponibilità e prezzi

Durante l’anteprima, i modelli GPT-5.6 saranno inizialmente disponibili tramite API e Codex a un gruppo selezionato di partner e organizzazioni fidate. Pianificano di renderli più ampiamente disponibili a persone che usano ChatGPT, Codex e l’API presto.

In questo nuovo sistema di denominazione introdotto con GPT-5.6, il numero identifica la generazione di un modello, mentre Sol, Terra e Luna identificano livelli di capacità durevoli che possono avanzare con la propria cadenza. Insieme, la famiglia dà a persone e sviluppatori scelte più chiare tra intelligenza, velocità e costo.

GPT-5.6 è prezzato per 1M token su tre dimensioni di modello: Sol è $5 input / $30 output; Terra è $2,50 input / $15 output; e Luna è $1 input / $6 output. Questi prezzi — tradotto in soldoni — rendono Terra la metà del costo di GPT-5.5 con prestazioni competitive, e Luna l’opzione più economica mai offerta.

GPT-5.6 introduce anche prompt caching più prevedibile, incluso supporto per breakpoint di cache espliciti e una vita minima della cache di 30 minuti. Per GPT-5.6 e modelli successivi, le scritture in cache sono fatturate a 1,25x la tariffa input senza cache del modello, mentre le letture dalla cache continuano a ricevere lo sconto del 90% sull’input cached.

Lanciano anche GPT-5.6 Sol su Cerebras fino a 750 token al secondo a luglio. 750 token al secondo. Quella velocità che fino a ieri sembrava fantascienza. L’accesso sarà inizialmente limitato a clienti selezionati mentre espandono la capacità.

OpenAI chiude dicendo che sono entusiasti di continuare a imparare da questo periodo di anteprima, e di portare GPT-5.6 Sol, Terra e Luna a più persone presto. Presto. Nelle prossime settimane, ripetono. Vedremo se mantengono.