OpenAI lancia GPT-5.2: il modello più avanzato per sviluppatori e professionisti

L’intelligenza artificiale al servizio del lavoro professionale

Il 10 dicembre 2025, OpenAI ha presentato ufficialmente GPT-5.2, la nuova generazione della sua famiglia di modelli linguistici progettata specificamente per attività professionali che richiedono competenze specialistiche. Questo rilascio rappresenta un salto qualitativo nell’integrazione dell’intelligenza artificiale nei processi lavorativi, con prestazioni che in alcuni ambiti superano quelle dei professionisti umani esperti.

Il contesto di questo lancio è particolarmente significativo: OpenAI ha agito in risposta a una situazione competitiva sempre più pressante, dopo che Google Gemini 3 aveva conquistato le posizioni di vertice in diversi benchmark. La “Code Red” interna dichiarata dal CEO Sam Altman ha portato a una riorganizzazione delle priorità aziendali, con il rinvio di progetti come l’introduzione della pubblicità in ChatGPT per concentrare tutte le risorse sul miglioramento del prodotto principale.

Tre versioni per diverse esigenze professionali

GPT-5.2 si articola in tre varianti distinte, ciascuna ottimizzata per specifici scenari d’uso:

GPT-5.2 Instant: progettato per attività quotidiane rapide, dalle ricerche di informazioni alla scrittura tecnica
GPT-5.2 Thinking: dedicato a compiti complessi che richiedono analisi approfondite e ragionamento multi-step
GPT-5.2 Pro: la versione più avanzata per domande estremamente complesse dove la qualità della risposta giustifica tempi di elaborazione più lunghi

Gli utenti enterprise di ChatGPT già dichiarano di risparmiare tra 40 e 60 minuti al giorno con le versioni precedenti. Con GPT-5.2, OpenAI punta a incrementare ulteriormente questo valore economico, particolarmente nelle attività di creazione di fogli di calcolo, sviluppo di presentazioni, scrittura di codice e gestione di progetti complessi a più fasi.

Prestazioni che ridefiniscono gli standard del settore

Sul benchmark GDPval, che misura le prestazioni in attività professionali attraverso 44 professioni diverse, GPT-5.2 Thinking ha raggiunto un traguardo storico: supera o eguaglia i migliori professionisti del settore nel 70,9% delle comparazioni, secondo giudici umani esperti. Si tratta del primo modello di OpenAI a operare a un livello pari o superiore a quello di un esperto umano in questo tipo di valutazioni.

I dati economici associati sono ancora più impressionanti: GPT-5.2 Thinking ha prodotto risultati per le attività GDPval a una velocità superiore di oltre 11 volte e a un costo inferiore all’1% rispetto ai professionisti esperti. Questi numeri suggeriscono che, quando abbinato a una supervisione umana adeguata, il modello può supportare in modo significativo il lavoro professionale riducendo drasticamente tempi e costi.

Eccellenza nella programmazione e nell’ingegneria del software

Nel campo dello sviluppo software, GPT-5.2 Thinking stabilisce un nuovo standard con il 55,6% su SWE-bench Pro, una rigorosa valutazione che testa quattro linguaggi di programmazione in scenari reali. Su SWE-bench Verified, il modello raggiunge addirittura l’80%, dimostrando capacità concrete nel debug del codice di produzione, nell’implementazione di nuove funzionalità e nella rifattorizzazione di codebase estese.

I primi tester hanno rilevato miglioramenti particolarmente significativi nello sviluppo front-end e nel lavoro con interfacce complesse o non convenzionali, specialmente quando coinvolgono elementi 3D. Questo rende GPT-5.2 un supporto quotidiano potente per gli ingegneri che operano in ambiti diversificati.

Scienza, matematica e ragionamento avanzato

OpenAI sostiene che GPT-5.2 Pro e GPT-5.2 Thinking siano attualmente i modelli migliori al mondo per assistere e potenziare il lavoro degli scienziati. Su GPQA Diamond, un benchmark contenente domande di livello avanzato in fisica, chimica e biologia, GPT-5.2 Pro raggiunge il 93,2%, mentre GPT-5.2 Thinking si attesta al 92,4%.

Su FrontierMath, una valutazione dedicata alla matematica di livello esperto, GPT-5.2 Thinking ha risolto il 40,3% dei problemi dei primi tre livelli, stabilendo un nuovo riferimento di eccellenza. Questi risultati non sono solo teorici: in un lavoro recente, alcuni ricercatori hanno utilizzato GPT-5.2 Pro per esplorare una questione aperta nell’ambito dell’apprendimento statistico, e il modello ha proposto una dimostrazione successivamente verificata e revisionata da esperti esterni.

Il superamento della soglia del 90% su ARC-AGI

Su ARC-AGI-1 (Verified), un benchmark progettato per misurare la capacità di ragionamento generale, GPT-5.2 è diventato il primo modello a superare la soglia del 90%. Questo risultato migliora l’87% ottenuto da o3-preview lo scorso anno, riducendo il costo necessario per raggiungere tale prestazione di circa 390 volte.

La versione più recente del benchmark, ARC-AGI-2 (Verified), presenta una difficoltà maggiore e isola meglio il ragionamento fluido. Su questo test, GPT-5.2 Thinking raggiunge il 52,9%, mentre GPT-5.2 Pro ottiene il 54,2%, estendendo ulteriormente la capacità del modello di ragionare su problemi nuovi e astratti.

Il confronto con i competitor nell’era della “Code Red”

La competizione nell’intelligenza artificiale generativa è attualmente particolarmente intensa. Google Gemini 3, lanciato a novembre 2025, aveva conquistato le classifiche su LMArena e molti benchmark, costringendo OpenAI a una risposta rapida e decisa. Gemini 3 Deep Think raggiunge il 93,8% su GPQA Diamond, leggermente superiore al GPT-5.2 Pro.

Anthropic Claude Opus 4.5, rilasciato il 24 novembre 2025, mantiene il primato nella programmazione su alcuni benchmark specifici, con l’80,9% su SWE-bench Verified contro l’80% di GPT-5.2. Tuttavia, su GDPval, il benchmark proprietario di OpenAI, GPT-5.2 Thinking surclassa i competitor: 70,9% contro il 59,6% di Claude Opus 4.5 e il 53,3% di Gemini 3 Pro.

Architettura tecnica e infrastruttura

GPT-5.2 è stato sviluppato in collaborazione con NVIDIA e Microsoft. I data center Azure e le GPU NVIDIA, inclusi H100, H200 e GB200-NVL72, supportano l’infrastruttura di addestramento su larga scala di OpenAI. Questa partnership consente di ampliare la capacità di elaborazione in modo affidabile e di portare nuovi modelli sul mercato più rapidamente.

Per gli sviluppatori che utilizzano l’API, i prezzi sono i seguenti:

GPT-5.2: 1,75 dollari per milione di token in input, 14 dollari per milione di token in output
GPT-5.2 Pro: 21 dollari in input, 168 dollari in output
Sconto del 90% sui token memorizzati nella cache per tutti i modelli

Nonostante il costo per token più elevato rispetto a GPT-5.1, OpenAI sostiene che il costo totale per raggiungere un determinato livello di qualità sia inferiore grazie alla maggiore efficienza di GPT-5.2.

Sicurezza e gestione dei contenuti sensibili

GPT-5.2 integra significativi miglioramenti nella gestione di contenuti sensibili. Il modello si basa sulla ricerca del “completamento sicuro” introdotta con GPT-5, che insegna al sistema a fornire la risposta più utile pur rimanendo entro i limiti di sicurezza definiti.

Le conversazioni che indicano segnali di suicidio o autolesionismo, disagio mentale o dipendenza emotiva dal modello vengono gestite con maggiore attenzione. OpenAI sta inoltre implementando un sistema di previsione dell’età per applicare automaticamente protezioni sui contenuti agli utenti di età inferiore ai 18 anni, limitando l’accesso a materiali sensibili.

Integrazione e disponibilità per sviluppatori

GPT-5.2 è già stato integrato in diverse piattaforme chiave del settore tecnologico. GitHub Copilot lo ha reso disponibile dall’11 dicembre per utenti Pro, Pro+, Business ed Enterprise. Notion ha testato internamente il modello con il nome in codice “Olive Oil Cake” prima del lancio ufficiale.

Partner enterprise come Databricks, Hex, Triple Whale, Cognition, Warp, JetBrains e Augment Code hanno riportato miglioramenti significativi nelle performance per task di coding, data science e analisi documenti. Al Orbach, amministratore delegato di Triple Whale, ha commentato: “GPT-5.2 ha reso possibile un cambio completo della nostra architettura. Abbiamo consolidato un fragile sistema multi-agente in un unico mega-agente con oltre 20 strumenti.”

Prospettive per il 2026 e oltre

OpenAI ha indicato che non ci sono piani immediati per ritirare GPT-5.1, GPT-5 o GPT-4.1 dall’API. GPT-5.1 resterà disponibile per gli utenti paganti per tre mesi come modello legacy su ChatGPT, ma verrà poi dismesso.

Sam Altman ha dichiarato alla CNBC che prevede di uscire dallo stato di “Code Red” entro gennaio 2026, suggerendo che l’azienda ritiene di aver riguadagnato terreno competitivo con questo rilascio. Tuttavia, OpenAI riconosce apertamente che ci sono ancora ambiti in cui gli utenti chiedono di più, particolarmente per quanto riguarda l’eccesso di rifiuti in alcune richieste.

La distribuzione di GPT-5.2 su ChatGPT avverrà in modo graduale per mantenere la piattaforma stabile e affidabile. Gli utenti che inizialmente non vedono il modello disponibile possono riprovare ad accedere in un momento successivo. Nell’API, invece, tutti i modelli della famiglia GPT-5.2 sono già disponibili per tutti gli sviluppatori.