L’arrivo di GPT-5.4 nel panorama dell’AI professionale
OpenAI ha rilasciato GPT-5.4, presentato come il suo modello più capace ed efficiente per il lavoro professionale. Non è l’ennesimo aggiornamento incrementale – stiamo parlando di tre varianti distinte: la versione standard, GPT-5.4 Thinking (specializzato nel ragionamento), e GPT-5.4 Pro per task complessi che richiedono performance massime.
L’accesso al modello base è disponibile per tutti gli abbonati paganti di ChatGPT (Plus, Team, Enterprise), mentre gli utenti Free dovranno sperare che le loro query vengano automaticamente instradate verso questo modello. GPT-5.4 Pro invece rimane esclusivo per chi paga l’abbonamento ChatGPT Pro da $200 al mese o per i clienti Enterprise.
Computer use nativo: finalmente integrato
Ecco una delle novità che cambia davvero le carte in tavola: GPT-5.4 è il primo modello general-purpose di OpenAI con capacità native di computer use. Tradotto in termini pratici? Il modello può cliccare, digitare e navigare software attraverso screenshot e comandi mouse/tastiera, senza bisogno di un modello specializzato separato che faccia da intermediario.
I numeri parlano chiaro. Su OSWorld-Verified, GPT-5.4 ha ottenuto il 75.0% – una bella differenza rispetto al 47.3% della versione precedente GPT-5.2. Non male per un salto generazionale.
Context window da un milione di token
Disponibile via API, questa è la finestra di contesto più ampia mai offerta da OpenAI. Un milione di token – che per chi non mastica questi numeri significa poter elaborare documenti mastodonti o conversazioni lunghissime senza perdere il filo del discorso.
Performance che si traducono in risultati concreti
Il benchmark GDPval racconta una storia interessante: GPT-5.4 raggiunge l’83.0% nelle comparazioni con professionisti umani attraverso 44 occupazioni diverse. GPT-5.2 si fermava al 70.9%. Sono numeri che fanno riflettere sul divario che si sta riducendo tra intelligenza artificiale e competenze professionali umane.
Ma c’è un altro aspetto che merita attenzione. L’efficienza nell’uso dei token. In un test con 36 server MCP abilitati, la nuova funzione “tool search” ha ridotto l’uso dei token del 47% mantenendo la stessa accuratezza. Meno token significa costi più bassi e risposte più rapide – due aspetti che nel mondo reale fanno la differenza.
Tool search: cercare solo quando serve
Questa funzionalità nell’API permette al modello di ricevere solo una lista leggera degli strumenti disponibili, recuperando le definizioni complete solo quando necessario. È un approccio intelligente che riduce latenza e costi nei workflow che utilizzano molti strumenti contemporaneamente.
Meno allucinazioni, più affidabilità
Le affermazioni fattuali individuali hanno il 33% di probabilità in meno di essere false rispetto a GPT-5.2. Le risposte complete? Il 18% in meno di contenere errori. Sono percentuali che nell’uso quotidiano si traducono in maggiore affidabilità, specialmente quando si tratta di informazioni critiche.
Performance professionale nel settore finanziario
Su un benchmark interno di modellazione finanziaria per analisti junior in investment banking, GPT-5.4 ha raggiunto l’87.5% contro il 68.4% di GPT-5.2. La performance su benchmark di investment banking è schizzata dal 43.7% di GPT-5 all’88.0% di GPT-5.4 Thinking.
Questi numeri hanno un significato preciso: il modello sta diventando uno strumento realmente utilizzabile in contesti professionali dove l’accuratezza non è negoziabile.
ChatGPT arriva nei fogli di calcolo
ChatGPT per Excel e Google Sheets è in fase beta. L’integrazione diretta nei fogli di calcolo permette di costruire, analizzare e aggiornare modelli finanziari complessi senza uscire dall’ambiente di lavoro abituale. Per chi passa le giornate tra colonne e formule, questa potrebbe essere una svolta pratica.
Microsoft Foundry e prezzi dell’API
GPT-5.4 sarà disponibile in Microsoft Foundry con una struttura di prezzi interessante:
- $2.50 per milione di input token
- $0.25 per milione di cached input token
- $15.00 per milione di output token
GPT-5.4 Pro invece costa $30.00 per milione di input token e $180.00 per milione di output token. Prezzi che vanno valutati in base al volume di utilizzo e al valore che il modello può generare nel proprio contesto specifico.
Sicurezza e chain-of-thought
OpenAI ha introdotto una nuova valutazione per testare la catena di ragionamento dei modelli. I test mostrano che GPT-5.4 Thinking è meno propenso a nascondere il proprio ragionamento rispetto alle versioni precedenti – un aspetto rilevante quando si tratta di comprendere come il modello arriva a determinate conclusioni.
GPT-5.4 Thinking in ChatGPT
La versione Thinking presenta ora un preambolo per query lunghe e complesse. La cosa interessante? Si possono aggiungere istruzioni o modificare la direzione a metà risposta. È disponibile su chatgpt.com e app Android, mentre la versione iOS arriverà a breve.
Integrazioni finanziarie specializzate
Le nuove integrazioni con FactSet, MSCI, Third Bridge e Moody’s unificano dati di mercato, aziendali e interni in un unico workflow. Le “Skills” riutilizzabili permettono di automatizzare lavori ricorrenti come earnings preview, analisi comparabili, DCF e redazione di investment memo.
Cosa significa per chi sviluppa e integra AI
GPT-5.4 rappresenta un passo avanti concreto nell’evoluzione dei modelli linguistici applicati al lavoro professionale. Le capacità di computer use native, la riduzione delle allucinazioni e l’efficienza nell’uso dei token lo rendono uno strumento da considerare seriamente per chi sta sviluppando o integrando soluzioni AI.
La questione non è se questo modello sia perfetto – nessun modello lo è. La questione è se offre miglioramenti tangibili rispetto alle alternative disponibili, e i benchmark suggeriscono di sì. Resta da vedere come si comporterà nei casi d’uso reali, dove i test sintetici spesso raccontano solo una parte della storia.
Per sviluppatori e aziende che lavorano con l’AI, GPT-5.4 offre strumenti nuovi e performance migliorate. L’integrazione con Microsoft Foundry e la struttura dei prezzi API lo rendono accessibile per progetti di varie dimensioni. Ora tocca metterlo alla prova sul campo.
