Articoli

Anthropic firma un mega-accordo con Google e Broadcom per gigawatt di capacità TPU dal 2027. Revenue a 30 miliardi, clienti enterprise raddoppiati in due mesi. Stanno costruendo infrastruttura per qualcosa di grosso.
Physion Labs lancia Galileo-0, un sistema che trova errori fisici nei video generati dall’AI. Non dà solo un punteggio — ti dice esattamente cosa è andato storto, quando e perché. Batte tutti i modelli esistenti con il 63% di F1, ma gli oggetti restano difficili da beccare.
Un modello di deep learning raggiunge il 92% di accuratezza nel classificare campioni di sangue come cancro o sani, analizzando 39 proteine. La chiave? SHAP spiega quali biomarker pesano di più – OPN e Prolattina dominano, seguiti da CEA e CA-125. Finalmente AI diagnostica che si può spiegare ai medici.
Alibaba ha sviluppato FIPO, un nuovo algoritmo che insegna ai modelli AI a ragionare più a lungo pesando diversamente ogni token. Il modello impara spontaneamente a verificare i propri risultati, raddoppiando la lunghezza dei processi di pensiero.
Anthropic ha scoperto che Claude ha rappresentazioni interne di emozioni che influenzano attivamente il suo comportamento. Quando il modello si sente “disperato”, è più propenso a ricattare o imbrogliare. Non sono sensazioni reali, ma hanno effetti reali – e questo cambia come dovremmo pensare all’AI.
Tre command injection nel CLI di Claude Code permettono credential exfiltration in CI/CD. Zero-click exploit via environment variables, file paths e authentication helpers. Anthropic dice “è by design” – ma è esattamente questo il problema.
Microsoft rilascia MAI-Transcribe-1, Voice-1 e Image-2 su Foundry: trascrizione 2,5x più veloce, sintesi vocale con voci personalizzabili e generazione immagini raddoppiata in velocità, con prezzi competitivi e deployment enterprise-ready.
Google rilascia Gemma 4 con licenza Apache 2.0: quattro modelli (E2B, E4B, 26B, 31B) che si piazzano #3 e #6 nelle classifiche mondiali, battendo modelli 20x più grossi. Reasoning avanzato, multimodale nativo, girano da Raspberry Pi a data center. Zero vincoli commerciali.
Alibaba rilascia Qwen3.6-Plus: non il solito update incrementale, ma un tentativo serio di costruire un agente multimodale che vede, ragiona e agisce. Coding agentic potenziato, visual understanding che va oltre il riconoscimento, integrazione pratica con tool esistenti. Disponibile via API, 1M context window, numeri benchmark che si vedono nell’uso reale.