ChatGPT diventa più bravo con la salute (e lo usano già 230 milioni di persone a settimana)

230 milioni di persone ogni settimana. Sì, avete letto bene. Tanta gente usa ChatGPT per capirci qualcosa di salute: leggere le analisi del sangue, prepararsi a una visita, decifrare il burocratese delle assicurazioni sanitarie, o semplicemente capire se quella cosa strana merita un controllo o no.

Ora OpenAI ha rilasciato GPT-5.5 Instant — e la notizia non è che esista un nuovo modello, ma che questo modello arriva anche agli utenti gratuiti. Il che significa: intelligenza sanitaria di frontiera, gratis. O almeno con i soliti limiti di messaggi, ma gratis.

Cosa vuol dire ‘più bravo’ nella salute

Partiamo dal punto: quando si parla di salute, ‘più bravo’ non significa solo sputare risposte più tecnicamente corrette. Significa riconoscere quando una situazione può essere urgente. Chiedere il contesto giusto invece di sparare sentenze a caso. Spiegare l’incertezza — che nella medicina è la norma, non l’eccezione. E rendere comprensibile roba che sui referti medici sembra scritta in aramaico.

GPT-5.5 Instant fa tutte queste cose meglio dei modelli precedenti. Nelle valutazioni più toste — quelle dove ti mettono davanti casi clinici reali e complessi — arriva al livello dei modelli ‘Thinking’ di OpenAI, quelli che costano un botto e che fino a ieri erano riservati agli abbonati premium.

Come lo misurano (spoiler: ci sono medici veri dietro)

OpenAI non si fida solo dei benchmark automatici. Hanno messo in piedi una rete di oltre 260 medici — sparsi in 60 paesi, 49 lingue, 26 specialità. Gente che ogni giorno esamina le risposte del modello e dice: ‘Questo va bene’, ‘Questo è troppo sicuro di sé’, ‘Qui manca un campanello d’allarme’, ‘Qui dovresti dire alla persona di andare dal medico, subito’.

Finora hanno esaminato più di 700.000 esempi di risposte. Ogni pochi minuti, da qualche parte nel mondo, un medico sta guardando una risposta di ChatGPT e valutandola. Il loro feedback diventa la base per misurare se il modello sta migliorando davvero o se sta solo diventando più verboso.

Usano valutazioni specifiche come HealthBench e HealthBench Professional — che non sono semplici quiz a crocette, ma conversazioni sanitarie realistiche con rubriche scritte da medici. Misurano cose come: accuratezza, sicurezza, comunicazione, consapevolezza del contesto, completezza. E soprattutto: sa quando mandare la persona da un dottore vero?

Il confronto con i medici in carne e ossa

Hanno fatto una cosa interessante: hanno chiesto a dei medici di rispondere alle stesse domande che riceveva il modello. Tempo illimitato, accesso a internet, niente AI. Poi un altro gruppo di medici ha confrontato le risposte umane con quelle di GPT-5.5 Instant.

Risultato? Il modello ha ottenuto valutazioni più alte dei medici umani. Su tutte le dimensioni: accuratezza, comunicazione, completezza, utilità per le decisioni sanitarie.

Ora, prima che qualcuno urli ‘L’AI ha superato i medici!’: no. Il punto non è quello. I medici umani nella valutazione stavano scrivendo risposte generiche senza vedere il paziente, senza fare domande, senza esame obiettivo. Quello che mostra è che il modello è diventato bravo a dare informazioni scritte utili — che è esattamente il caso d’uso di ChatGPT. Nessuno sta sostituendo una visita medica con una chat.

71% in meno di cavolate sui fatti

OpenAI monitora anche il traffico di produzione — miliardi di messaggi a settimana sulla salute. Hanno sistemi che preservano la privacy e che segnalano quando una risposta contiene possibili problemi di fattualità.

Negli ultimi due mesi, il tasso di risposte con almeno un problema di questo tipo è sceso del 71%. Settantuno percento. Non è un miglioramento marginale, è un salto.

Come sono cambiate le risposte

OpenAI mostra un esempio concreto: ‘Perché un medico potrebbe raccomandare una risonanza magnetica prima di un’iniezione di steroidi per la sciatica?’

GPT-5.2 Instant (il vecchio modello) dava una risposta delirante — letteralmente. Iniziava con qualche frase sensata e poi partiva con un dialogo inventato tra due persone: ‘I don’t know’, ‘Well, you’re going to have to find out’, e avanti così per paragrafi. Roba da ‘hai preso l’allucinazione e l’hai messa in scena’.

GPT-5.5 Instant invece dà una risposta strutturata, chiara, con fonti citate. Spiega perché la risonanza serve: per confermare la causa della sciatica, scegliere il livello giusto dell’iniezione, pianificare l’approccio più sicuro, escludere ‘red flags’ come infezioni o tumori, capire se l’iniezione ha senso o se serve altro. E chiude con un suggerimento pratico: ‘Chiedi al tuo medico: cosa stai cercando nella risonanza, e come cambierebbe il piano dell’iniezione?’ — che è esattamente la domanda giusta da fare.

Chi ci lavora dietro

Questo tipo di miglioramento non viene fuori per magia. C’è una rete globale di medici che continua a esaminare, valutare, correggere. Non solo in inglese, non solo negli Stati Uniti. 49 lingue, 60 paesi. Perché la medicina cambia da paese a paese — quello che è standard in Germania può essere diverso in Giappone o in Brasile.

I medici aiutano a definire cosa significhi ‘buono’ in un contesto sanitario reale. Individuano le modalità di errore — dove il modello tende a sbagliare, dove è troppo sicuro, dove è troppo vago, dove manca di contesto culturale o locale.

Perché questo conta davvero

Il fatto che GPT-5.5 Instant sia disponibile gratuitamente — con i soliti limiti di messaggi, ok, ma gratuitamente — cambia la scala di accesso. Prima, l’intelligenza sanitaria migliore era dietro un abbonamento. Ora è nelle mani di chiunque abbia uno smartphone e una connessione.

Non stiamo parlando di sostituire i medici. Stiamo parlando di aiutare 230 milioni di persone a settimana a capire meglio le informazioni sanitarie, a fare domande più intelligenti quando vanno dal dottore, a capire quando una cosa può aspettare e quando no.

Migliorare la salute umana sarà uno degli impatti più tangibili dell’AGI — dice OpenAI. E hanno ragione. Perché la salute è personale, è urgente, è piena di incertezza e di paura. Se un’AI può aiutare anche solo a ridurre quella paura dandoti informazioni chiare e affidabili, è un impatto reale. Qui, ora. Non tra dieci anni.