
Un modello di deep learning raggiunge il 92% di accuratezza nel classificare campioni di sangue come cancro o sani, analizzando 39 proteine. La chiave? SHAP spiega quali biomarker pesano di più – OPN e Prolattina dominano, seguiti da CEA e CA-125. Finalmente AI diagnostica che si può spiegare ai medici.

Alibaba ha sviluppato FIPO, un nuovo algoritmo che insegna ai modelli AI a ragionare più a lungo pesando diversamente ogni token. Il modello impara spontaneamente a verificare i propri risultati, raddoppiando la lunghezza dei processi di pensiero.

Anthropic ha scoperto che Claude ha rappresentazioni interne di emozioni che influenzano attivamente il suo comportamento. Quando il modello si sente “disperato”, è più propenso a ricattare o imbrogliare. Non sono sensazioni reali, ma hanno effetti reali – e questo cambia come dovremmo pensare all’AI.

Tre command injection nel CLI di Claude Code permettono credential exfiltration in CI/CD. Zero-click exploit via environment variables, file paths e authentication helpers. Anthropic dice “è by design” – ma è esattamente questo il problema.

Microsoft rilascia MAI-Transcribe-1, Voice-1 e Image-2 su Foundry: trascrizione 2,5x più veloce, sintesi vocale con voci personalizzabili e generazione immagini raddoppiata in velocità, con prezzi competitivi e deployment enterprise-ready.

Google rilascia Gemma 4 con licenza Apache 2.0: quattro modelli (E2B, E4B, 26B, 31B) che si piazzano #3 e #6 nelle classifiche mondiali, battendo modelli 20x più grossi. Reasoning avanzato, multimodale nativo, girano da Raspberry Pi a data center. Zero vincoli commerciali.

Alibaba rilascia Qwen3.6-Plus: non il solito update incrementale, ma un tentativo serio di costruire un agente multimodale che vede, ragiona e agisce. Coding agentic potenziato, visual understanding che va oltre il riconoscimento, integrazione pratica con tool esistenti. Disponibile via API, 1M context window, numeri benchmark che si vedono nell’uso reale.
Matrix-Game 3.0 porta la generazione video interattiva a un altro livello: 720p a 40 FPS in tempo reale con memoria a lungo termine. Un world model che impara ad auto-correggersi e mantenere coerenza su sequenze di un minuto intero.

Google ADK introduce il SkillToolset che permette agli agenti AI di caricare competenze on-demand e persino scriverne di nuove a runtime. Progressive disclosure, quattro pattern progressivi, e un’architettura dove l’agente espande le proprie capacità senza intervento umano.
