Project Glasswing ha trovato 10.000 vulnerabilità critiche in un mese. Ora il problema è risolverle

Un mese fa Anthropic ha lanciato Project Glasswing: l’idea era usare Claude Mythos Preview — il loro modello AI ancora non pubblico — per trovare vulnerabilità nel software più critico del mondo prima che qualcun altro lo faccia con intenzioni meno nobili.

I numeri del primo mese? Oltre 10.000 vulnerabilità di gravità alta o critica. Sì, diecimila. Trovate da una cinquantina di partner che includono pezzi da novanta tipo Cloudflare, Mozilla, Microsoft, Oracle.

E qui arriva il punto: il problema non è più trovare le falle. È risolverle.

Quando l’AI va più veloce degli umani

Cloudflare ha scovato 2.000 bug in un mese, di cui 400 critici o ad alta severità. Il loro team dice che il tasso di falsi positivi di Mythos Preview è migliore di quello dei tester umani. Migliore. Lasciate che questo dato sedimenti.

Mozilla ha trovato 271 vulnerabilità in Firefox 150 durante i test con Mythos Preview. Con la versione precedente di Claude, Opus 4.6, ne avevano trovate dieci volte meno su Firefox 148.

Diversi partner raccontano che la velocità con cui trovano bug è aumentata di oltre dieci volte. Il che suona fantastico finché non realizzi che dall’altra parte ci sono esseri umani che devono verificare, scrivere patch, testarle, distribuirle.

Palo Alto Networks ha rilasciato un aggiornamento con cinque volte più patch del solito. Microsoft ha avvertito che ‘il numero di nuove patch continuerà a crescere per un po”. Oracle sta trovando e risolvendo vulnerabilità più velocemente di sempre. Ma ‘più veloce di prima’ non significa abbastanza veloce.

Il collo di bottiglia si è spostato

Anthropic stessa ha scannerizzato oltre 1.000 progetti open-source. Mythos Preview ha stimato di aver trovato 6.202 vulnerabilità ad alta o critica severità. Di queste, 1.752 sono state valutate attentamente da sei aziende indipendenti di security research.

Il 90,6% si è rivelato reale. Non falsi allarmi, falle vere. Di queste, il 62,4% è stato confermato come ad alta o critica severità. Fate i conti: anche se Mythos non trovasse più nulla da qui in avanti, siamo già a quasi 3.900 vulnerabilità critiche nel solo codice open-source.

Un esempio? Una falla in wolfSSL, una libreria crittografica open-source usata da miliardi di dispositivi. Mythos ha costruito un exploit che permetterebbe a un attaccante di falsificare certificati — tipo creare un sito fasullo di una banca che all’utente sembrerà perfettamente legittimo. Ora è patchata, per fortuna. Il CVE assegnato è CVE-2026-5194.

Ma guardate il dashboard pubblico che Anthropic ha messo online: c’è un crollo verticale a ogni fase del processo. Trovare la vulnerabilità? Fatto. Verificarla? Ci vuole tempo. Scrivere un report dettagliato? Ancora tempo. Aspettare che il maintainer crei una patch? Ancora di più.

I maintainer open-source sono al collasso

Diversi maintainer hanno chiesto ad Anthropic di rallentare le segnalazioni. Sì, avete letto bene: rallentare. Non perché non vogliano risolvere i problemi, ma perché non ce la fanno a star dietro al ritmo.

In media una vulnerabilità critica trovata da Mythos Preview richiede due settimane per essere patchata. E stiamo parlando di software critico, quello su cui gira internet. I maintainer open-source — molti dei quali sono volontari — si trovano sommersi da un diluvio di segnalazioni AI, molte delle quali di bassa qualità.

Anthropic ha segnalato finora 530 bug ad alta o critica severità. Di questi, solo 75 sono stati patchati. Solo 65 hanno avuto advisory pubblici. Perché così pochi? Tre motivi: siamo ancora dentro la finestra dei 90 giorni standard per il disclosure coordinato; molte patch vengono rilasciate senza advisory pubblici; e poi c’è il fatto semplice e brutale che l’ecosistema della sicurezza è già sovraccarico.

La fase intermedia è il vero problema

Modelli con capacità simili a Mythos Preview saranno presto disponibili pubblicamente. Non è un ‘se’, è un ‘quando’. E questo crea un problema di timing pericoloso.

Prima, il processo era: scopri la vulnerabilità (lento), crea una patch (lento), distribuiscila agli utenti finali (lentissimo). Questo lasciava tempo per agire. Ora la prima fase è diventata istantanea, ma le altre due no. La finestra in cui un attaccante può sfruttare una falla nota si è drammaticamente accorciata.

Claude Mythos Preview riduce tempo e costi per trovare e sfruttare vulnerabilità. Il che significa che quella patch che prima potevi permetterti di testare con calma per una settimana? Ora è un rischio.

Cosa fare nel frattempo

I consigli di Anthropic non sono rivoluzionari, ma sono urgenti:

Se sviluppi software: accorcia i cicli di rilascio delle patch. Rendi gli aggiornamenti il più semplici possibile da installare. Insisti con gli utenti che girano ancora versioni vecchie con falle note. Sì, anche quando rompono le scatole.

Se difendi reti: accorcia i tempi di test e deploy delle patch. Implementa i controlli critici del NIST e del National Cyber Security Centre UK: configurazioni di rete più rigide, autenticazione multi-fattore obbligatoria, log completi per detection e response. Cose che migliorano la sicurezza senza dipendere da una singola patch che arriva in tempo.

Gli strumenti (pubblici) per difendersi

Nel frattempo Anthropic sta rilasciando strumenti per aiutare chi non ha accesso a Mythos Preview. Claude Security è ora in beta pubblica per i clienti Enterprise: scansiona il codice, trova vulnerabilità, propone fix. In tre settimane Claude Opus 4.7 ha patchato oltre 2.100 vulnerabilità.

C’è anche il Cyber Verification Program, che permette ai professionisti della sicurezza di usare i modelli Anthropic per ricerca legittima di vulnerabilità, penetration testing e red-teaming senza alcuni dei safeguard pensati per prevenire abusi.

E ora Anthropic sta rendendo disponibili su richiesta gli stessi strumenti che hanno usato internamente con Mythos: le ‘skills’ (istruzioni custom), un harness per mappare il codebase e far girare agenti di scansione, un threat model builder che identifica i target potenziali e dà priorità al lavoro del modello.

Cisco, uno dei partner di Glasswing, ha reso open-source le sue Foundry Security Spec per aiutare altri defender a costruire sistemi di valutazione simili.

Il paradosso di Mythos

Anthropic non ha ancora rilasciato pubblicamente Mythos Preview. Il motivo è semplice e inquietante: nessuna azienda — inclusa Anthropic — ha sviluppato safeguard abbastanza forti da impedire che un modello del genere venga usato per fare danni seri.

Ma altri lab AI svilupperanno presto modelli simili. E se uno di quelli viene rilasciato senza safeguard adeguati, diventerà improvvisamente molto più facile e economico per chiunque nel mondo sfruttare software vulnerabile.

Per questo esiste Project Glasswing: dare ai defender più importanti un vantaggio asimmetrico prima che sia troppo tardi. Ma l’urgenza è reale: serve che il maggior numero possibile di organizzazioni rinforzi le proprie difese cyber. Ora.

Anthropic espanderà Glasswing ad altri partner critici — inclusi governi USA e alleati. E ‘nel prossimo futuro’, una volta sviluppati safeguard molto più robusti, Mythos-class verrà rilasciato pubblicamente.

Dall’altra parte di questi rischi c’è un mondo migliore: codice critico molto più solido di oggi, hacking molto meno diffuso. Gli ostacoli ci sono, eccome. Ma per ora il messaggio è chiaro: la corsa è iniziata, e i difensori devono correre più veloce.