Notizie AI del 02 Luglio 2026

Ola todos! ecco le notizie dedicate al mondo IA del 02 Luglio 2026Iniziamo con xAI che ha lanciato Voice Agent Builder. Costruisci agenti vocali senza scrivere codice, zero punto zero cinque dollari al minuto. Tutto incluso. Riconoscimento vocale, modello e sintesi vocale. Una sola API. Il sistema gestisce accenti, rumore di fondo e interruzioni. Venticinque lingue supportate. Oltre ottanta voci integrate o cloni la tua con due minuti di audio.Passiamo a Anthropic. Claude Fable Cinque torna disponibile oggi a livello globale. Dopo confronti con il governo USA, il modello ora include nuovi classificatori per bloccare attività di cybersecurity. Alcuni task di routine come coding e debugging ricadranno temporaneamente su Opus quattro punto otto. Nei prossimi giorni ridurranno i falsi positivi. Hanno anche avviato la stesura di un framework condiviso con Amazon, Microsoft, Google e altri partner Glasswing per valutare la gravità dei jailbreak e definire protocolli di risposta standardizzati. Collaborazione rafforzata con il governo su test pre-rilascio e condivisione informazioni.Nel frattempo, NVIDIA ha convertito un modello da trenta miliardi in uno più veloce senza riaddestramento completo. Il trucco. Duplica il modello in due copie. Una legge il prompt e memorizza il contesto, l’altra scrive blocchi di testo contemporaneamente invece di una parola alla volta. Risultato: due punto quattro volte più veloce, mantiene il novantanove percento della qualità originale. Ha richiesto solo l’otto percento dei dati di training originali per imparare il nuovo meccanismo.Ollama porta Gemma Quattro a velocità quasi raddoppiata su Apple Silicon grazie a MLX. Il miglioramento deriva dalla predizione multi-token ora attiva per default. Ollama regola automaticamente quanti token anticipare durante l’esecuzione, evitando rallentamenti quando la speculazione non contribuisce più.Sul fronte ricerca, Neural Theorizer introduce NEO, un modello mondo che impara a teorizzare il mondo dall’osservazione, senza supervisione linguistica o LLM. Accettato come presentazione orale a ICML duemilasedici, solo lo zero punto sette percento dei paper sottomessi. Il sistema scopre primitive riutilizzabili, le compone in spiegazioni eseguibili e trasferisce quelle spiegazioni a fenomeni nuovi.Da segnalare anche GVHMR, un sistema che ricostruisce completamente il movimento umano in tre dimensioni da un singolo video. Sviluppa un nuovo sistema di coordinate basato sulla gravità terrestre e sulla visuale della camera, eliminando errori di posizione e accumulo di drift. Applicazioni concrete in produzione video e realtà aumentata.Sempre attivo, NVIDIA con vLLM versione zero punto venticinque. Cinquecento settantuno commit da duecentocinquantasei contributori. Supporto per MiniMax M Tre con FP Otto e MXFP Quattro, tuning AMD esteso, DeepSeek V Quattro matura con cache indice sparso FlashInfer, nuovo Streaming Parser Engine unificato per chiamate tool e ragionamento, DiffusionGemma, DeepEP versione due per parallelismo esperto ampio.Arriva anche Qwen Tre punto sei trentacinque miliardi A Tre B in formato NVFP Quattro da NVIDIA. Modello Mixture of Experts compresso in precisione FP Quattro, quattro volte più piccolo in memoria, mantiene le capacità originali.Occhio a Fish Audio. Il loro modello vocale migliore S Due punto Uno Pro ora gratuito per sviluppatori. API libera, ottantatre lingue, nessun limite rigido di utilizzo. Stesso endpoint già in uso, basta impostare model: “s2.1-pro-free”.Merita attenzione il nuovo skill ufficiale di Claude Code versione due punto uno punto centonovantotto. Skill slash dataviz carica linee guida per selezione tipo grafico, regole layout e gerarchia visiva per interfacce ricche di dati. Include un validatore palette colori eseguibile, così Claude controlla contrasto e accessibilità in modo programmatico invece che a intuito.Proseguiamo con Google. Gemini Spark arriva su macOS nell’app Gemini. Supporto per Model Context Protocol custom per costruire assistenti personalizzati. Integrazioni con Canva, Dropbox, Instacart, OpenTable e Zillow Rentals. Connessioni con Google Tasks e Google Keep per trasformare note in azioni. Tracciamento eventi in tempo reale: sport, azioni, notizie.Spostamoci su Agent Reach, repository del mese. Dai occhi al tuo agente IA per vedere l’intero internet. Legge e cerca Twitter, Reddit, YouTube, GitHub, Bilibili, XiaoHongShu. Una CLI, zero costi API. Ventisei mila stelle guadagnate il mese scorso, totale quarantasette mila stelle.Interessante anche OctoSense, piattaforma open source MIT per acquisizione dati sensoriali. Sincronizza temporalmente LiDAR, telecamere termiche ed eventi, dati veicolo da auto e robot. Include dataset di guida e camminata per un totale di cinquantanove ore, tra i più grandi al mondo.Si muove anche Fal con TRELLIS punto due LoRA Trainer. Addestra un adattatore LoRA tre dimensioni da una cartella di asset tridimensionali. Affina forma e texture, genera GLB che rispettano il tuo stile. Esclusivo su Fal.Segnaliamo anche InfiniteTalk. Repository GitHub aperto con settemila stelle. Converte immagine o video in clip parlanti guidati da audio. Sincronizza bocca, testa, corpo ed espressioni. Supporta generazione di durata illimitata.Un aggiornamento da Cloudflare. Lista d’attesa aperta per Monetization Gateway. Permette di addebitare per qualsiasi pagina web, dataset, API o tool MCP dietro Cloudflare. I pagamenti si regolano in stablecoin tramite protocollo aperto x quattrocentodue.Altra novità: GLM Cinque punto Due ora ha ZCode, ambiente ufficiale di sviluppo. Gli abbonati GLM Coding Plan ricevono quota d’uso aumentata del cinquanta percento in ZCode. Supporta Bring Your Own Key. Disponibile su macOS, Windows e Linux.Colpo a sorpresa da Harvey. Ottimizzazione harness porta DeepSeek V Quattro Pro da zero percento a cinque percento all-pass rate su Legal Agent Benchmark, raggiungendo Sonnet Quattro punto Sei a un settimo del costo. Il benchmark contiene casi legali realistici con workspace chiusi di documenti e chiede deliverable concreti: memo diligence, liste issue, redline, bozze. Giudice LLM valuta contro rubrica lunga con sessantuno criteri binari distinti per task.Ancora Gemma Quattro. Un developer ha usato Fable Cinque per scrivere kernel ottimizzati che portano Gemma Quattro a duecentocinquantacinque token al secondo su WebGPU con M Quattro. Demo disponibile per prova diretta in browser.Chiudiamo con OpenMontage. Primo sistema open source agentic per produzione video. Prendi un prompt, fa ricerca, scrive script, trova footage gratuito da Pexels Pixabay NASA, aggiunge musica, sottotitoli, renderizza output. Dodici pipeline professionali, cinquantadue tool, oltre cinquecento skill agente. Budget controllato e verifica qualità automatica post-render. Lavora con Claude Code e Cursor. Quasi trentamila stelle su GitHub.Trovate i link di queste notizie altri link interessanti sul mio sto ziobuddalabs punto itSalvate il video così da non perderlo, seguitemi sui miei canali social e sul nuovo podcast su spotify e mannaggia a voi se ancora non lo state facendo, condividete il video con amici e nemici e ola todos.