Claude Fable 5 e Mythos 5: Anthropic lancia l’AI più potente mai vista (con il freno a mano tirato)

Anthropic ha lanciato Claude Fable 5, e questa volta non stiamo parlando di un normale aggiornamento incrementale. Parliamo di un modello che — loro parole — supera tutto quello che hanno mai rilasciato al pubblico. State-of-the-art su quasi tutti i benchmark testati, con prestazioni eccezionali in ingegneria software, lavoro cognitivo, visione artificiale, ricerca scientifica. Insomma, la lista è lunga.

Ma c’è un dettaglio non da poco: questo modello è così capace che hanno dovuto lanciarla con le ruote frenate. Sì, perché senza protezioni, le capacità di Fable 5 in cybersecurity potrebbero essere usate per combinare guai seri. Quindi hanno fatto una cosa interessante: quando l’AI rileva domande su certi argomenti sensibili, invece di rispondere lei passa la palla a Claude Opus 4.8, il modello di livello inferiore. Una specie di ‘scusa, questa domanda me la prende il mio collega meno qualificato’.

Due modelli, stessa base, protezioni diverse

Insieme a Fable 5, arriva anche Claude Mythos 5. Stesso identico modello sotto il cofano, ma con le protezioni tolte in alcune aree. Mythos 5 sarà disponibile solo per un gruppo ristretto: difensori informatici e fornitori di infrastrutture critiche, attraverso il Project Glasswing in collaborazione col governo USA. Le capacità in cybersecurity? Le più forti al mondo, secondo Anthropic.

Il prezzo è interessante: 10 dollari per milione di token in input, 50 per milione in output. Meno della metà rispetto a Claude Mythos Preview. Non proprio spiccioli, ma considerando le capacità, è un taglio significativo.

I numeri che fanno girare la testa

Durante i test iniziali, Stripe ha riferito che Fable 5 ha compresso mesi di lavoro ingegneristico in giorni. In una codebase Ruby da 50 milioni di righe — sì, avete letto bene, cinquanta milioni — il modello ha eseguito una migrazione su tutta la base di codice in un giorno. Un lavoro che altrimenti avrebbe richiesto a un intero team più di due mesi.

Sul benchmark FrontierCode di Cognition, che testa se i modelli riescono a passare task di coding difficili rispettando gli standard delle codebase di produzione di alta qualità, Fable 5 ha il punteggio più alto tra i modelli frontier, anche a medio sforzo. Token-efficient, lo chiamano.

Lavoro cognitivo e finanza

Sul Finance Benchmark di Hebbia per ragionamento di livello senior, Fable 5 ha ottenuto il punteggio più alto tra tutti i modelli, con guadagni sostanziali nel ragionamento basato su documenti, interpretazione di grafici e tabelle, problem solving. IMC ha notato che Fable 5 ha superato quasi tutte le loro valutazioni di analisi trading, inclusi lookup fattuali, ragionamento concettuale, analisi delle cause radice e analisi del valore atteso.

Visione artificiale

Fable 5 è il nuovo state-of-the-art per task che coinvolgono la visione. Può estrarre numeri precisi da figure scientifiche dettagliate e svolgere compiti complessi basati sulla visione, come ricostruire il codice sorgente di un’app web solo dagli screenshot. E qui viene il bello: i modelli Claude precedenti facevano fatica a giocare a Pokémon FireRed anche con harness che davano loro strumenti di aiuto aggiuntivi. Fable 5 ha battuto FireRed con un harness minimo, solo visione. Niente mappe, niente aiuti di navigazione, niente informazioni extra sullo stato del gioco. Solo gli screenshot grezzi del gioco.

Hanno pubblicato un timelapse: Claude che gioca a Pokémon dall’inizio alla fine usando solo screenshot. Diciamo che vedere un’AI battere un Pokémon degli anni 2000 con solo la vista fa un certo effetto.

Memoria e contesto lungo: finalmente funziona

Fable 5 rimane concentrato attraverso milioni di token in task di lunga durata e migliora i propri output usando le proprie note. Quando hanno fatto giocare il modello a Slay the Spire — il gioco di deck-building amato dai nerd — dargli accesso alla memoria persistente basata su file ha migliorato le sue prestazioni tre volte di più rispetto a Opus 4.8. E ha raggiunto l’atto finale del gioco tre volte più spesso.

Ma le demo diventano ancora più impressionanti. Fable 5 ha costruito una simulazione del sistema solare, derivando il moto orbitale dei pianeti dai primi principi della fisica e usandolo per prevedere le eclissi solari. Ha giocato autonomamente a Factorio — il gioco di costruzione di fabbriche amato dagli ingegneri — strategizzando e costruendo una fabbrica automatizzata da solo. Ha progettato un modello 3D completo stampabile in un editor CAD basato su browser. E l’editor stesso? Creato da Fable 5, copilota AI incluso.

Ah, e ha codificato una simulazione fluida sincronizzata al ritmo di un remix EDM di musica classica. Remix che Fable 5 ha prodotto usando codice, senza aver mai sentito musica prima. Ok, forse quest’ultima è più una curiosità che altro, ma rende l’idea.

Drug design e biologia: qui diventa serio

Usando Mythos 5, gli esperti interni di design proteico di Anthropic hanno accelerato aspetti del processo di drug design di circa dieci volte. In un esempio, hanno scoperto che Mythos 5, con strumenti di design proteico e bioinformatica ma senza assistenza umana, eguaglia o batte operatori umani qualificati. E non parliamo di task semplici: il modello esegue tutti i compiti normalmente completati da uno scienziato. Scelta dei siti di legame, selezione e esecuzione di strumenti di design proteico, recupero dai fallimenti lungo la strada.

Nove dei 14 target proteici di questo studio hanno prodotto candidati forti per il drug design che stanno attualmente investigando. Target che includono checkpoint immunitari, segnalazione di fattori di crescita e recettori, neurodegenerazione, malattie muscolari.

Ipotesi scientifiche nuove, davvero nuove

Mythos 5 è il loro primo modello a produrre costantemente ipotesi scientifiche nuove e convincenti. In confronti testa a testa in cieco contro modelli classe Opus, gli scienziati di Anthropic hanno preferito le ipotesi di biologia molecolare di Mythos circa l’80% delle volte. E diverse sono passate alla valutazione sperimentale.

Nel frattempo, un’ipotesi di Mythos — un meccanismo nuovo per una proteina di E. coli — è stata corroborata in uno studio da un laboratorio che lavorava indipendentemente sullo stesso problema. Quando la tua AI prevede qualcosa e poi un laboratorio vero lo conferma senza saperlo, beh, significa che stai facendo qualcosa di giusto.

Ricerca genomica autonoma

Mythos 5 ha condotto ricerca genomica originale in oltre una settimana di lavoro largamente autonomo. Ha assemblato dati single-cell per milioni di cellule che coprono 138 specie animali, ha progettato e addestrato un modello custom di machine learning per identificare cellule che svolgono lo stesso ruolo anche in organismi distantemente correlati.

Con solo input umano di alto livello, il modello addestrato di Mythos 5 ha superato un modello recente pubblicato sulla rivista Science. Nonostante fosse 100 volte più piccolo. Hanno intenzione di pubblicare questi risultati nei prossimi mesi.

Le protezioni: perché Fable è ‘castrata’ e Mythos no

I modelli classe Mythos hanno raggiunto una soglia in cui presentano rischi significativi. Ad aprile hanno iniziato il Project Glasswing, rilasciando il primo modello classe Mythos (Claude Mythos Preview) solo a un gruppo limitato di difensori informatici e fornitori di infrastrutture software critiche.

Ora le protezioni sono abbastanza robuste per un rilascio generale. Ma hanno deliberatamente tarato le protezioni per essere caute — a volte richieste benigne attiveranno i loro classificatori. Lo riconoscono: sarà frustrante per alcuni utenti. L’obiettivo è ridurre i falsi positivi man mano che aggiornano e raffinano le protezioni dopo il lancio.

I classificatori di sicurezza

Fable 5 arriva con un nuovo set di classificatori: sistemi AI separati che rilevano potenziali abusi, inclusi tentativi di jailbreak, e impediscono al modello principale di rispondere. Quando i classificatori di Fable rilevano una richiesta relativa a cybersecurity, biologia e chimica, o distillazione, la risposta viene automaticamente gestita da Claude Opus 4.8. Gli utenti verranno informati quando questo accade.

I loro dati iniziali mostrano che più del 95% delle sessioni di Fable non comporta alcun fallback — per quelle sessioni, le prestazioni di Fable 5 sono effettivamente le stesse di Mythos 5. Quindi per la maggior parte degli utenti, nella maggior parte del tempo, non noteranno differenze.

Cybersecurity: qui non si scherza

I modelli classe Mythos eccellono nello scoprire e sfruttare vulnerabilità software. Possono rendere gli attacchi informatici sostanzialmente più facili e economici da commettere. I modelli classe Mythos mostrano anche forti capacità nell’hacking agenticо — eseguire più parti diverse di un attacco informatico oltre a trovare exploit. Reconnaissance, discovery, lateral movement, e altro.

Hanno testato estensivamente i loro classificatori per verificarne la robustezza contro i jailbreak. Oltre ai test interni, hanno eseguito un bug bounty esterno che non ha prodotto jailbreak universali in oltre 1.000 ore di test. Le organizzazioni esterne di red-teaming che hanno ingaggiato non sono riuscite a trovare jailbreak universali su task agentici a lungo termine finora. Anche se l’UK AISI ha fatto progressi verso uno entro una breve finestra di test iniziale.

È probabilmente impossibile prevenire completamente i jailbreak universali, ma il loro obiettivo è rendere qualsiasi jailbreak rimanente sufficientemente lento e costoso da poter essere rilevato e prevenuto prima che venga usato su larga scala.

Biologia e chimica: protezioni ampie (forse troppo)

Da tempo usano classificatori per bloccare i loro modelli dal rispondere a una selezione ristretta di query relative ad armi biologiche. Ma non sono più certi che bloccare questa selezione ristretta sia sufficiente. Due motivi: primo, hanno ragione di preoccuparsi di attori malintenzionati con buone risorse che tentano di ottenere uplift dai loro modelli per ricerca biologica ad alto rischio. Secondo, i modelli ora hanno una maggiore capacità di completare task scientifici nel mondo reale.

Hanno testato la capacità di Mythos 5 di completare un passaggio impegnativo nella progettazione di virus adeno-associati (AAV). Gli AAV sono un componente per fornire terapie geniche, ma la stessa capacità, nelle mani sbagliate, potrebbe consentire la progettazione di virus pericolosi. Mythos ha superato modelli sofisticati dedicati ai task proteici (chiamati ‘protein language models’) usando solo il suo ragionamento biologico. Promettente per la ricerca e sviluppo della terapia genica — ma evidenzia anche il rischio posto da tali capacità dual-use.

La loro priorità era rilasciare Fable in sicurezza il prima possibile, anche al costo di protezioni eccessivamente ampie. Quindi, per il momento, hanno organizzato che Fable ricada su Opus 4.8 sulla maggior parte delle richieste relative a biologia e chimica. Come per tutti i loro classificatori, sperano di restringere queste protezioni il prima possibile. C’è un grande potenziale per applicazioni positive di Fable per la scienza, e non vogliono che i falsi positivi dai loro classificatori si mettano in mezzo.

Distillazione: proteggere il modello da sé stesso

Hanno precedentemente identificato tentativi su larga scala di estrarre (‘distillare’) le capacità di Claude per addestrare modelli concorrenti in paesi autoritari. La distillazione delle abilità di Fable 5 potrebbe indirettamente portare alla proliferazione di capacità AI near-frontier — e queste potrebbero essere rilasciate senza le protezioni appropriate. Le richieste che vengono segnalate dai loro classificatori come parte di tali tentativi di distillazione ricadranno su Opus 4.8.

Nuova politica di conservazione dati

Stanno facendo un cambiamento nel modo in cui gestiscono i dati dei clienti business per Fable 5, Mythos 5 e futuri modelli con livelli di capacità simili o superiori. Richiederanno una conservazione di 30 giorni per tutto il traffico sui modelli classe Mythos.

Non useranno questi dati per addestrare nuovi modelli Claude, o per qualsiasi scopo non correlato alla sicurezza. E hanno istituito nuove protezioni della privacy, incluso il logging di tutti gli accessi umani ai dati e la garanzia della loro cancellazione dopo 30 giorni in quasi tutti i casi. I dati li aiuteranno a difendersi da attacchi complessi e nuovi (inclusi nuovi jailbreak e attacchi che operano attraverso molte richieste) oltre ad aiutarli a identificare e ridurre i falsi positivi.

Mythos 5 e il programma di accesso fidato

A partire da oggi, tutti gli utenti che attualmente hanno accesso a Claude Mythos Preview (ad esempio, i loro partner di cybersecurity nel Project Glasswing) potranno aggiornare a Claude Mythos 5 — lo stesso modello di Claude Fable 5 ma con le protezioni informatiche tolte. Gli utenti troveranno Mythos 5 paragonabile a, o un po’ più forte di, Mythos Preview nella maggior parte dei casi, costando sostanzialmente meno.

In consultazione col governo USA, pianificano di espandere costantemente l’accesso a Claude Mythos 5, continuando l’aggiunta periodica di nuovi partner, oltre a perseguire un programma di accesso fidato che consente alle organizzazioni di cybersecurity di fare domanda in modo più sistematico.

I loro piani includono anche l’apertura di un programma di accesso fidato per la biologia, per aiutare ad accelerare la ricerca biomedica e scoprire nuove terapie con capacità classe Mythos. Questo programma fornirà accesso a Fable 5 con le protezioni di biologia e chimica rimosse (ma le protezioni informatiche ancora in atto). Arruolerà un piccolo numero di ricercatori da una varietà di organizzazioni di scienze della vita.

Disponibilità e prezzi: come ottenerlo

Claude Fable 5 è disponibile ovunque da oggi. Claude Mythos 5 è limitato ai partner Glasswing (con protezioni informatiche tolte) e presto a selezionati ricercatori di biologia (con protezioni di biologia e chimica tolte) solo, fino a quando il loro programma di accesso fidato più ampio non sarà disponibile.

Il prezzo per entrambi i modelli è 10 dollari per milione di token in input e 50 dollari per milione di token in output. Gli sviluppatori possono usare claude-fable-5 tramite l’API Claude.

Si aspettano che la domanda per Fable 5 sia molto alta e difficile da prevedere. Sull’API Claude e sui piani Enterprise basati sul consumo, Fable 5 è completamente disponibile da oggi. Per i piani in abbonamento, stanno procedendo in fasi:

Da oggi fino al 22 giugno, Fable 5 è incluso nei piani Pro, Max, Team ed Enterprise basati su posti senza costi aggiuntivi. Il 23 giugno, rimuoveranno Fable 5 da quei piani. Usarlo dopo quella data richiederà crediti di utilizzo. Se la capacità lo consente, estenderanno la finestra inclusa. Dopo questo punto — quando la capacità sufficiente glielo consentirà — mirano a ripristinare Fable 5 come parte standard dei piani in abbonamento. Intendono farlo il più rapidamente possibile.

Durante questo periodo, comunicheranno qualsiasi cambiamento in anticipo così gli utenti sapranno come stanno le cose.

Il feedback dei primi utenti

I clienti con accesso anticipato hanno eseguito i propri test su Fable 5. Una selezione di quello che stanno vedendo, con le loro parole:

Cursor ha detto: ‘Claude Fable 5 è il modello state of the art su CursorBench. Ha aperto una classe di problemi a lungo orizzonte che erano fuori portata per i modelli precedenti.’

GitHub: ‘Claude Fable 5 è un vero passo avanti per gli sviluppatori che GitHub serve. Nei nostri test iniziali, ha affrontato task di coding complessi e a lungo orizzonte con un livello di autonomia e affidabilità che ha superato i benchmark precedenti.’

Replit: ‘Questi sono i risultati più forti di qualsiasi modello Claude che abbiamo avuto l’opportunità di testare. Claude Fable 5 è un chiaro passo avanti sul coding agenticio e la prototipazione.’

Hebbia: ‘Claude Fable 5 è il primo a superare il 90% sul nostro benchmark di analisi principale di task analitici complessi e di lunga durata — un salto di 10 punti rispetto a Opus. Sulle domande più difficili, mostra forte giudizio e attenzione alle sfumature.’

Val.town: ‘Claude Fable 5 capisce cosa intendono i builder, non solo cosa digitano. App che richiedevano un centinaio di prompt un anno fa, ora le one-shotta. Quando un cliente davvero sbatte contro un muro, è il modello a cui ci rivolgiamo per farlo passare velocemente.’

Allineamento: si comporta bene?

Nella loro valutazione automatizzata dell’allineamento hanno scoperto che il livello di comportamento disallineato di Mythos 5 (incluse azioni disallineate intraprese dal modello come inganno e cooperazione con l’abuso del modello da parte di un utente) era basso e simile a quello di Opus 4.8. Dato che sono lo stesso modello sottostante, il livello di allineamento di Fable 5 sarà simile. La valutazione è descritta per intero, insieme a una suite dettagliata di altri test di sicurezza e capacità, nella system card del modello.

Insomma. Anthropic ha rilasciato il modello più potente che abbia mai fatto, ma con il freno a mano tirato per la maggior parte degli utenti. Le capacità ci sono tutte — i test lo dimostrano — ma per ora dovrete accontentarvi delle protezioni. A meno che non siate difensori informatici o ricercatori selezionati, nel qual caso: benvenuti nel club Mythos. Per tutti gli altri, c’è Fable. Che comunque non è male. Anzi.