
Google smonta e ricostruisce un agente AI sales da prototipo fragile a sistema production-ready. Cinque lezioni brutalmente pratiche su architettura distribuita, RAG dinamico, e come non bruciare il budget token.
Google presenta ReasoningBank: un framework che permette agli agenti AI di imparare sia dai successi che dai fallimenti, distillando memorie strategiche riutilizzabili. Nei test, +8.3% di success rate e meno esplorazione random grazie a memorie che evolvono da checklist base a logica preventiva complessa.

Claude Cowork esce dalla beta con controlli enterprise: permessi per ruolo, limiti spesa per team, analytics admin e telemetria estesa. Le aziende lo stanno usando per delegare il lavoro che circonda i task core, non i task stessi.

Google DeepMind ha mappato le nuove minacce agli agenti AI autonomi: non serve attaccare il modello, basta avvelenare l’ambiente in cui naviga. Sei categorie di trappole, proof-of-concept già funzionanti.

Moonshot AI rilascia K2.6, modello open-source che compete con GPT-5.4 e Claude Opus su coding complesso. 300 agent in parallelo, 4.000 tool call in 12 ore, +185% performance su codice legacy. Licenza Apache 2.0.

Gemma 4 jailbreakato da un agente AI autonomo: zero guardrail, zero censure, gira sul tuo telefono. 4.9GB di libertà digitale che Google non voleva darti.
Opus 4.6 senza pensiero adattivo surclassa Opus 4.7 con pensiero adattivo su domande trabocchetto. Il modello nuovo decide quando ragionare ed è troppo aggressivo nel saltare il pensiero – risultato: risposte sbagliate ma sicure.
Anthropic lancia Claude Design, lo strumento che ti permette di creare prototipi, slide e design collaborando con l’AI. Disponibile per utenti Pro, Max, Team ed Enterprise — dal prompt al prodotto finito in minuti.

Tencent rilascia HY-World 2.0: primo world model open-source che genera e ricostruisce asset 3D editabili (non video usa-e-getta). Output importabili direttamente in Blender, Unity, Unreal – da prompt o foto a scene 3DGS navigabili.
