Project Glasswing: quando l’AI trova bug che sopravvivono da 27 anni

Anthropic ha appena sganciato una bomba: Claude Mythos Preview, un modello AI che trova vulnerabilità di sicurezza meglio degli umani. Non “abbastanza bene” – meglio. Tipo, ha scovato un bug in OpenBSD che dormiva lì da 27 anni. OpenBSD, per chi non lo sapesse, è quel sistema operativo che ha fama di essere praticamente inespugnabile. […]

Anthropic firma accordo da gigawatt con Google e Broadcom per i datacenter del futuro

Anthropic ha appena chiuso un accordo con Google e Broadcom per diversi gigawatt di capacità computazionale di nuova generazione basata su TPU. I primi datacenter dovrebbero attivarsi nel 2027. L’accordo — il più grande investimento infrastrutturale nella storia dell’azienda — servirà a sostenere la crescita esplosiva di Claude e la domanda dei clienti enterprise che […]

Galileo-0: il critico AI che trova gli errori fisici nei video generati

Physion Labs ha rilasciato Galileo-0, un sistema che analizza i video generati dall’AI cercando errori fisici. Non si limita a dire “questo video fa schifo” — ti spiega esattamente cosa è andato storto, quando è successo e perché viola le leggi della fisica. Il problema: i video sembrano veri ma non lo sono Nel loro […]

Reti neurali e diagnosi oncologica: quando l’AI spiega le sue decisioni (con SHAP)

Quando un algoritmo ti dice “hai un tumore”, la prima domanda che ti viene in mente non è “quanto sei preciso?”. È “perché lo pensi?” Questo studio del 2026 affronta esattamente questo problema: costruire un sistema di machine learning che non solo classifichi campioni di sangue come “cancro” o “sano”, ma che spieghi – in […]

Alibaba insegna ai modelli AI a pensare più a lungo (e meglio)

Il team Qwen di Alibaba ha sviluppato un nuovo algoritmo di training per modelli di ragionamento che assegna pesi diversi ai singoli token in base a quanto ogni passaggio influenza la catena di ragionamento successiva, invece di trattare tutti i token allo stesso modo. L’approccio ha portato a catene di ragionamento notevolmente più lunghe, con […]

Claude ha emozioni funzionali (e questo cambia tutto)

Tutti i modelli linguistici moderni a volte si comportano come se avessero emozioni. Dicono di essere felici di aiutarti, si scusano quando sbagliano. A volte sembrano frustrati o ansiosi quando faticano con un compito. Ma cosa c’è dietro questi comportamenti? Il team di Interpretability di Anthropic ha analizzato Claude Sonnet 4.5 e ha trovato qualcosa […]

Claude Code CLI: 3 Command Injection Flaws — CI/CD Risk

Il 31 marzo 2026, un artefatto di debugging in un package npm ha esposto il codice sorgente completo del CLI di Claude Code di Anthropic. Nel giro di poche ore, il team Purple Graph di Phoenix Security ha iniziato l’analisi degli attack path, identificando 100 ipotesi iniziali che si sono ridotte a 8 vulnerabilità concrete […]

Microsoft lancia MAI-Transcribe-1, Voice-1 e Image-2: trascrizione, voce e immagini AI

Microsoft ha rilasciato tre nuovi modelli AI attraverso la piattaforma Foundry: MAI-Transcribe-1 per la trascrizione vocale, MAI-Voice-1 per la sintesi vocale e MAI-Image-2 per la generazione di immagini. MAI-Transcribe-1: trascrizione multilingue veloce MAI-Transcribe-1 gestisce la trascrizione speech-to-text nelle 25 lingue più utilizzate secondo il benchmark FLEURS. La velocità di trascrizione batch è 2,5 volte superiore […]

Gemma 4: Google sgancia i modelli open più potenti di sempre

Allora, preparatevi. Google ha appena rilasciato Gemma 4 – e no, non è il solito aggiornamento incrementale dove changelog dice “performance improvements” e tu non vedi mezza differenza. Questa volta parliamo di modelli che si piazzano terzo posto assoluto nelle classifiche mondiali. Terzo. Battendo roba proprietaria che costa abbonamenti mensili. I numeri che contano (e […]

Qwen3.6-Plus: il modello che vuole diventare un agente vero

Alibaba ha rilasciato Qwen3.6-Plus, e stavolta – a differenza dei soliti rilasci dove cambiano tre virgole nel changelog – pare che abbiano fatto sul serio. Il modello è già disponibile via API su Alibaba Cloud Model Studio, e le cifre sui benchmark sono… interessanti. Ma sapete cosa mi ha colpito? Non tanto la potenza bruta […]