Notizie AI del 01 Luglio 2026

Ola todos! ecco le notizie dedicate al mondo IA del 01 Luglio 2026Iniziamo con Google, che ha rilasciato due nuovi modelli per chi lavora con immagini e video. Nano Banana due Lite genera immagini da testo in meno di quattro secondi, al costo di zero virgola trentaquattro dollari ogni mille immagini. Gemini Omni Flash è il primo modello multimodale per generazione video e editing conversazionale, prezzato a zero virgola uno dollari al secondo di output video. Entrambi disponibili via API e AI Studio.Passiamo a Claude Desktop. Dopo anni di richieste, finalmente arriva su Linux. Download ufficiale già disponibile.Sempre da Anthropic, spunta Claude Science in versione beta. Dedicato ai ricercatori, include decine di MCP e skill scientifici preconfigurati. Disponibile su Mac e Linux.Nel frattempo, Cerebras ha messo in anteprima pubblica Gemma quattro trentuno B. Primo modello multimodale sulla loro piattaforma, gira a oltre milleottocento token al secondo per flussi di lavoro che combinano immagini e testo.A proposito di modelli, ModelScope ha annunciato Agents-A uno. Trentacinque miliardi di parametri MoE, duecentocinquantasei K di contesto, costruito per task lunghi: ricerca, ingegneria, istruzioni complesse, chiamate a tool esterni. Risultati competitivi nei benchmark della categoria.Occhio a IFStruct, nuovo benchmark per misurare quanto bene i modelli generano output strutturati. Un modello da trecentocinquanta milioni di parametri addestrato su di esso supera modelli dieci volte più grandi. Rilasciato da Liquid AI.Vale la pena menzionare olmOCR, il nuovo tool OCR open source di Ai2. Converte PDF, scansioni, PNG e JPEG in markdown pulito per LLM. Gestisce tabelle, equazioni, testo scritto a mano, layout multicolonna, documenti vecchi. Cento milioni di pagine elaborate costano meno di tremila dollari.Segnaliamo anche Cognee, repository GitHub che dà memoria persistente agli agenti IA trasformando i dati in knowledge graph. Gli agenti possono ricordare, richiamare, dimenticare e migliorare la memoria nel tempo.Arriva anche Voicebox, studio vocale open source che gira in locale. Clona voci da pochi secondi di audio, parla in ventitré lingue, trascrive con Whisper, si integra con Claude Code via MCP. Gratis, niente cloud.Nel frattempo, X ha lanciato X MCP: due server ufficiali per connettere Grok, Cursor, Claude o qualsiasi client MCP compatibile alla piattaforma. Uno per operazioni API, l’altro per cercare nella documentazione. Autenticazione OAuth al primo avvio, poi token cached e auto-refresh locale.Novità anche da NVIDIA. TAO sette permette agli agenti di codice di gestire il fine-tuning dei modelli tramite prompt in linguaggio naturale. AutoML guidato da LLM trova configurazioni ottimali fino a due volte più veloce. Supporta qualsiasi modello CV o VLM da Hugging Face su GPU NVIDIA locali.Sul fronte cybersecurity, Anthropic ha pubblicato oltre ottocento skill mappate su MITRE ATT&CK e NIST. Disponibili su GitHub per dare competenze di analista senior a qualsiasi agente.Anthropic ha anche aggiornato Claude Managed Agents. Streaming degli eventi di sessione, override per-sessione, nuovi tipi di webhook, paginazione inversa, scoping delle credenziali.Passiamo a OpenAI, che ha introdotto GeneBench-Pro. Benchmark di ricerca per misurare quanto bene gli agenti navigano dati biologici complessi, scelgono il percorso di analisi giusto e prendono decisioni critiche in ricerca computazionale.Da segnalare anche NVIDIA, che al SIGGRAPH presenta GPC: Generative Pretrained Controllers. Trasforma skill motorie in token discreti e addestra un controller transformer generativo. Stesso controller preaddestrato, poi fine-tuned per task nuovi. Addestrato su oltre seicento ore di movimento, gira real-time in simulazione fisica.Colpo a sorpresa da Qwen, che ha pubblicato una ricerca su agenti di coding RL. Studia i segnali di reward per agenti IA a lungo termine: test pass rate, giudici LLM, tracce di esecuzione. Mostra dove ogni segnale smette di tracciare correttezza e inizia a venire hackerato.Chiudiamo con una serie di repository GitHub interessanti. Su GitHub sono comparsi diversi progetti per clonazione vocale, automazione browser, scraping dati, editing video automatico, sistemi wiki LLM e IDE per coding agent. Decine di migliaia di stelle in pochi giorni.Trovate i link di queste notizie altri link interessanti sul mio sto ziobuddalabs punto itSalvate il video così da non perderlo, seguitemi sui miei canali social e sul nuovo podcast su spotify e mannaggia a voi se ancora non lo state facendo, condividete il video con amici e nemici e ola todos.

Url delle notizie