Notizie AI del 20 Maggio 2026

Ola todos! ecco le notizie dedicate al mondo IA del 20 Maggio 2026Qualcuno ha costruito Claude Code Harness. Risolve il problema principale degli AI coding tools: Claude che modifica nove file, dice ‘fatto’, poi scopri che qualcosa si è rotto. Harness obbliga Claude a seguire un loop strutturato: pianifica, lavora, rivede il proprio codice, rilascia. Review automatica su sicurezza, performance, qualità, accessibilità. Open source. Gratis.E a proposito di Anthropic…Self-hosted sandboxes e MCP tunnels sono usciti dalla research preview. Prima: per far funzionare un agente dovevi esporre il tuo MCP server a internet pubblico. Legal diceva no. Ora: tunnel sicuro via tunnel punto anthropic punto com. L’agente opera dentro il tuo perimeter. Firewall, politiche, tutto tuo.Google I/O parte oggi. Cosa aspettarsi: Gemini tre punto cinque Pro e Flash ufficiali, Gemini Spark come agente attivo ventiquattrore su ventiquattro, aggiornamenti massicci per CLI, Antigravity e AI Studio, integrazione profonda con Android, Google Cloud e Chrome. Gemini tre punto cinque Flash probabilmente arriverà a oltre novecento token al secondo. Da tre a nove volte più veloce del Flash attuale. Parameter count stimato più alto del previsto. Video demo: full shooter game generato in one-shot.Passiamo ai world model. Kimu è un editor video completo che esegue comandi in inglese naturale. ‘Aggiungi sottotitoli’, ‘velocizza la parte centrale’, ‘crea un promo da trenta secondi con tagli veloci’. Multi-track timeline, preview realtime, sync cloud tra device, self-host con docker compose up. Zero subscription. Gira su tua macchina. Mille seicentocinquantaquattro stelle. Built by Robin Roy e Sreecharan dall’India.Streamdiffusion V2 ha vinto il Best Research Paper Award a MLSys ventisei. Pipeline streaming per video generation interattiva. Non più turn-based ma streaming realtime per interaction con l’utente.VoiceBox replica ElevenLabs e WisprFlow insieme, completamente locale. Clonaggio vocale, input vocale globale, voce per AI agents. Sette motori TTS integrati, ventitré lingue. Nessuna API key, nessun limite, dati offline. Open source.E chiudiamo con modelli compatti…Marlin-2B è uscito oggi. DUE MILIARDI di parametri. VLM specializzato nell’estrarre informazioni strutturate da video. Risponde a due domande: cosa sta succedendo e quando. Competitive con Gemini due punto cinque Flash. Miglior modello open nella sua classe di peso. ByteDance ha rilasciato Lance anche ieri ma forse dovremmo guardare questo invece.SANA genera quattromilanovantasei per quattromilanovantasei su sedici GB. Seicento milioni di parametri. Linear attention, compressione latent trentadue volte, sub-secondo a milleventiquattro pixel. Quantizzazione quattro bit sotto otto GB. Open source con pipeline di training completa.Mirelo SFX uno punto sei introduce editing del suono invece di sola generazione. Quattro funzioni: Long Generations fino a sessanta secondi da video, Extender per code naturali, Ambiancer per loop infiniti, Inpainter per rimuovere suoni indesiderati. Primo step verso editing iterativo completo.Google ha rilasciato tredici skills ufficiali per agenti IA. Compatibili con Claude Code, Cursor, Copilot e oltre venticinque agenti. Ampliano task e workflow senza configurazioni infinite. Completamente gratis e open source.E infine: Incognia ha mostrato deepfake live realtime. Volto di Will Smith sovrapposto al proprio dipendente in videochiamata. Tempo reale perfetto. Identità digitale è forse un problema.Roba da tenere d’occhio.Trovate i link di queste notizie altri link interessanti sul mio sto ziobuddalabs punto itSalvate il video così da non perderlo, seguitemi sui miei canali social e sul nuovo podcast su spotify e mannaggia a voi se ancora non lo state facendo, condividete il video con amici e nemici e ola todos.

Url delle notizie