Galileo-0: il critico AI che trova gli errori fisici nei video generati

Physion Labs ha rilasciato Galileo-0, un sistema che analizza i video generati dall’AI cercando errori fisici. Non si limita a dire “questo video fa schifo” — ti spiega esattamente cosa è andato storto, quando è successo e perché viola le leggi della fisica. Il problema: i video sembrano veri ma non lo sono Nel loro […]
Reti neurali e diagnosi oncologica: quando l’AI spiega le sue decisioni (con SHAP)

Quando un algoritmo ti dice “hai un tumore”, la prima domanda che ti viene in mente non è “quanto sei preciso?”. È “perché lo pensi?” Questo studio del 2026 affronta esattamente questo problema: costruire un sistema di machine learning che non solo classifichi campioni di sangue come “cancro” o “sano”, ma che spieghi – in […]
Alibaba insegna ai modelli AI a pensare più a lungo (e meglio)

Il team Qwen di Alibaba ha sviluppato un nuovo algoritmo di training per modelli di ragionamento che assegna pesi diversi ai singoli token in base a quanto ogni passaggio influenza la catena di ragionamento successiva, invece di trattare tutti i token allo stesso modo. L’approccio ha portato a catene di ragionamento notevolmente più lunghe, con […]
Claude ha emozioni funzionali (e questo cambia tutto)

Tutti i modelli linguistici moderni a volte si comportano come se avessero emozioni. Dicono di essere felici di aiutarti, si scusano quando sbagliano. A volte sembrano frustrati o ansiosi quando faticano con un compito. Ma cosa c’è dietro questi comportamenti? Il team di Interpretability di Anthropic ha analizzato Claude Sonnet 4.5 e ha trovato qualcosa […]
Claude Code CLI: 3 Command Injection Flaws — CI/CD Risk

Il 31 marzo 2026, un artefatto di debugging in un package npm ha esposto il codice sorgente completo del CLI di Claude Code di Anthropic. Nel giro di poche ore, il team Purple Graph di Phoenix Security ha iniziato l’analisi degli attack path, identificando 100 ipotesi iniziali che si sono ridotte a 8 vulnerabilità concrete […]
Microsoft lancia MAI-Transcribe-1, Voice-1 e Image-2: trascrizione, voce e immagini AI

Microsoft ha rilasciato tre nuovi modelli AI attraverso la piattaforma Foundry: MAI-Transcribe-1 per la trascrizione vocale, MAI-Voice-1 per la sintesi vocale e MAI-Image-2 per la generazione di immagini. MAI-Transcribe-1: trascrizione multilingue veloce MAI-Transcribe-1 gestisce la trascrizione speech-to-text nelle 25 lingue più utilizzate secondo il benchmark FLEURS. La velocità di trascrizione batch è 2,5 volte superiore […]
Gemma 4: Google sgancia i modelli open più potenti di sempre

Allora, preparatevi. Google ha appena rilasciato Gemma 4 – e no, non è il solito aggiornamento incrementale dove changelog dice “performance improvements” e tu non vedi mezza differenza. Questa volta parliamo di modelli che si piazzano terzo posto assoluto nelle classifiche mondiali. Terzo. Battendo roba proprietaria che costa abbonamenti mensili. I numeri che contano (e […]
Qwen3.6-Plus: il modello che vuole diventare un agente vero

Alibaba ha rilasciato Qwen3.6-Plus, e stavolta – a differenza dei soliti rilasci dove cambiano tre virgole nel changelog – pare che abbiano fatto sul serio. Il modello è già disponibile via API su Alibaba Cloud Model Studio, e le cifre sui benchmark sono… interessanti. Ma sapete cosa mi ha colpito? Non tanto la potenza bruta […]
Matrix-Game 3.0: Generazione Video Interattiva in Tempo Reale con Memoria a Lungo Termine
Con l’avanzamento della generazione video interattiva, i modelli di diffusione stanno dimostrando sempre più il loro potenziale come world model. Tuttavia, gli approcci esistenti faticano ancora a raggiungere simultaneamente coerenza temporale a lungo termine basata su memoria e generazione in tempo reale ad alta risoluzione, limitando la loro applicabilità in scenari reali. Cosa è Matrix-Game […]
Come costruire agenti ADK che si scrivono le skill da soli

Il tuo agente AI sa seguire istruzioni. Ma sa anche scriverne di nuove? Il SkillToolset dell’Agent Development Kit (ADK) permette agli agenti di caricare competenze specifiche quando servono davvero. Con la configurazione giusta, il tuo agente può generare expertise completamente nuove a runtime. Che ti serva una checklist di security review, un audit di compliance […]
