Notizie AI del 30 Giugno 2026

Ola todos! ecco le notizie dedicate al mondo IA del 30 Giugno 2026Iniziamo con Magnific che lancia il plugin per i principali editor video. Premiere Pro, After Effects, DaVinci Resolve e Final Cut Pro ora integrano direttamente le funzioni di upscaling, relighting e rimozione sfondo. Aggiungi musica e voce IA all’editing, cerca tra duecentocinquanta milioni di asset stock. Disponibile per Mac e Windows.Passiamo a MegaTrain, che ribalta il modo in cui la GPU gestisce la memoria. Invece di caricare il modello intero, la VRAM diventa una cache temporanea. Il risultato? Training full-precision di modelli oltre i cento miliardi di parametri su una singola GPU. L’architettura si chiama ‘inversione della gerarchia di memoria’.xAI sta riscrivendo l’intero stack di Grok in C e C++. Via tutti i framework ad alto livello come PyTorch. Obiettivo: eliminare i layer intermedi e ottimizzare tutto per NVIDIA GB300. Utilizzo GPU previsto oltre il novanta percento, contro il sessanta-settanta attuale. Latenza ridotta, costi dimezzati.Vale la pena menzionare Aside, un browser IA che raggiunge il novantanove percento sui benchmark di navigazione autonoma. Batte Fable, GPT-5.4 e ogni altro agente browser testato. Design Liquid Glass, tab verticali, crittografia locale. Compatibile con abbonamenti Claude e ChatGPT esistenti.Sul fronte coding, ui-craft diventa un vero sistema multi-agente. Un comando e ogni agente di codifica guadagna gusto nel design. Claude Code, Cursor, Codex, Gemini, OpenCode: tutti supportati. Centosessantuno regole logiche, sessantasette stili UI.Interessante anche il playbook interno di Anthropic sul loop engineering, appena trapelato. Cinque principi: discovery, handoff, verification, persistence, scheduling. Separa sempre il generatore dal valutatore. Usa git worktrees per parallelizzare. Scrivi lo stato su disco. Fai girare tutto su timer.Occhio a olmOCR, strumento OCR costruito per l’era LLM. Prende PDF, scan, PNG, JPEG e li converte in Markdown pulito. Gestisce tabelle, equazioni, scrittura a mano, layout multi-colonna, figure, inset, vecchi scan. L’ordine di lettura naturale viene preservato.Google ha rilasciato Gemma 4 E4B IT, modello che gestisce qualsiasi tipo di input e output. Testo, immagini, tutto. Svolta per l’IA multimodale.Da segnalare anche Voicebox, alternativa locale e open source a ElevenLabs e WisprFlow. Text-to-speech completamente in locale, senza dipendenze cloud.Gemini 3.5 Flash integra ora la funzione ‘computer use’ direttamente nel modello. Gli agenti possono navigare e operare applicazioni in autonomia su qualsiasi piattaforma.Seedance 2.5 porta la narrazione video a trenta secondi. Riferimenti multi-modali estesi. Qualità cinematografica con transizioni fluide e audio sincronizzato.Google lancia Agents CLI, tooling end-to-end per agentic engineering. Scaffolding, eval, deployment e registrazione enterprise in un solo flusso. Sette skill ADK iniettati nel contesto dell’agente. Compatibile con Claude Code.OpenMed raggiunge i trecentoquaranta milioni di download di modelli. Millecinquecento modelli medici open source, tutti Apache 2.0. Seicentocinquanta girano su iPhone, completamente on-device.mi sono accorto dell’esistenza di freemocap su GitHub, tool di motion capture 3D gratuito. Niente attrezzatura professionale: bastano alcune webcam normali. Novemila stelle. Esporta in FBX, tutto locale.Torniamo su loop engineering con un framework completo appena rilasciato. Sei pattern production-ready: daily triage, CI sweeper, PR babysitter. Clona e avvia con Claude Code, Codex, Grok. CLI per valutare la readiness del codebase. Template SKILL punto md, STATE punto md.Cambio di scena: GLM-5.2 versione uncensored via abliteration. Quaranta miliardi attivi, un milione di token di contesto, zero guardrail corporate.Si muove anche Draft, knowledge base collaborativa per agenti. App desktop e CLI che sincronizza automaticamente il contesto per il team. Cartella locale separata dal codice di lavoro. Sincronizza meeting Granola, canali Slack, sessioni agente. Compatibile con Claude Code, Codex, Cursor, Hermes, OpenClaw. Locale, privato, open source.Meituan ha rilasciato InfiniteTalk. Una foto, una frase: escono video con sincronizzazione completa di bocca, testa, corpo. Durata illimitata. Basato su Wan Video Model. Apache-2.0, commercialmente utilizzabile. Richiede CUDA, ventiquattro GB VRAM minimo.DeepSeek V4 finale arriva a metà luglio. Quello attuale era solo ‘preview of V4’. Nuova meccanica di pricing: tariffe raddoppiate nelle ore di picco. Baseline invariato.Comfy lancia Comfy MCP in beta pubblica. Primo MCP costruito per pipeline produttive. Connette Claude, Codex, Cursor, Hermes all’ecosistema ComfyUI. Esegui qualsiasi workflow in linguaggio naturale. Cerca modelli, nodi, template. Centinaia di workflow pre-costruiti, sempre aggiornati.Ho trovato su GitHub cinque repository che sono esplosi questa settimana: MinerU, voicebox, ai-website-cloner-template, Anthropic-Cybersecurity-Skills, agent-native.Uno studio esamina se i sistemi di memoria per agenti siano davvero pronti. Memoria non è solo contesto lungo: serve rappresentazione, storage, estrazione, retrieval, routing, manutenzione. Dodici sistemi testati su undici dataset. Nessuna architettura vince su tutto. Memoria a grafo forte su fatti aggiornati, sistemi ibridi su recall filtrato.Browser Use lancia benchmark comparativo: GLM 5.2, Opus 4.7, GPT 5.5, Minimax M3. Task dall’LLM Arena dataset, sito generato, valutazione umana. Quale ha vinto? Controlla il repo.Headroom comprime tutto prima che arrivi al LLM. Sessanta-novantacinque percento meno token. Compatibile con tutti gli agenti. Stesse risposte.Agent-Reach sblocca l’accesso a quattordici piattaforme con un comando. Twitter, web scraping, B站, 小红书: tutto sbloccato. Gratuito, open source.Anthropoc ha pubblicato workshop di ventiquattro minuti su come fare prompt per Claude. Insegnato da chi l’ha costruito. Gratis, senza registrazione, senza paywall.Meta condivide Brain2Qwerty v2. Sistema non invasivo che decodifica frasi da segnali cerebrali in tempo reale. Sessantuno percento di accuratezza media sulle parole, settantotto percento per il miglior partecipante. Addestrato su ventiduemila frasi da nove volontari, dieci ore ciascuno con MEG. Codice training rilasciato.ui-ux-pro-max-skill raggiunge novantasettemila stelle su GitHub. Centosessantuno regole logiche, sessantasette stili UI. Si integra in ogni agente di codifica. I dashboard generati dall’IA non sembrano più cloni Bootstrap del 2014.The Agency trasforma strumenti di coding IA in un’azienda open source da centoquarantasette agenti.Cline lancia ClinePass. Abbonamento mensile flat che apre l’accesso a modelli open-weight curati. GLM 5.2, Kimi K2.7 Code, DeepSeek V4 Pro, MiniMax-M3, Qwen3.7. Sostituisce chiavi API separate attraverso provider.Hermes può lanciare subagent multipli contemporaneamente. Invece di lavorare in sequenza, spalma il lavoro su più agenti in parallelo. Verifica incrociata, poi unisce i risultati. Un team intero da un singolo prompt.ERPNext è un ERP completo iniziato nel 2011 a Mumbai. Contabilità, inventario, HR, payroll, produzione, CRM, progetti. Gratuito, GPL-3.0, trentaseimilacentosettantotto stelle. SAP costa tra ottocentomila e un milione e duecentomila dollari all’anno per cinquecento utenti. ERPNext si installa con un comando Docker in minuti.Meituan prepara un nuovo modello: uno punto sei trillioni totali, quarantotto miliardi attivi. Sparse attention custom, n-gram, adaptive expert computation, un milione di contesto. Trentacinque trillioni di token di training, optimizer muon, multi teacher OPD. Addestrato su cinquantamila GPU cinesi.Ed ecco una serie di notizie interessanti da non farsi scappare. Lindy passa a DeepSeek V4. Cursor adotta Kimi K2.5. Coinbase usa GLM-5.2 e Kimi 2.7. Shopify e Airbnb puntano su Qwen. Uber Eats su Qwen2. Siemens combina DeepSeek e Qwen. Microsoft testa DeepSeek V4.12-Factor Agents è una guida ingegneristica per costruire agenti stabili in produzione. Dodici principi chiave, distillati da conversazioni con centinaia di founder tecnici. Copre gestione contesto, chiamate tool, modellazione stato, flusso di controllo, convergenza errori, architettura modulare.Anthropic CEO Dario Amodei ha dichiarato ai legislatori che l’open-source IA sta percorrendo un percorso molto pericoloso.LTX-2.3 di Lightricks è primo overall tra i modelli open weights su Video Arena. Elo di millecentotrentotto. Salto di centoquindici punti rispetto a LTX-2 19B, attualmente quinto con milleventitrè.Cursor per iOS è disponibile. Lancia agenti cloud always-on. Oppure controlla da remoto agenti in esecuzione sul tuo computer dall’app. Composer 2.5 scontato del settantacinque percento fino al cinque luglio.Claude è ora disponibile in Microsoft Foundry, ospitato su Azure. I clienti Azure ottengono Claude Opus 4.8 e Claude Haiku 4.5. Autenticazione Azure, fatturazione e pensionamento degli impegni inclusi.Trovate i link di queste notizie altri link interessanti sul mio sto ziobuddalabs punto itSalvate il video così da non perderlo, seguitemi sui miei canali social e sul nuovo podcast su spotify e mannaggia a voi se ancora non lo state facendo, condividete il video con amici e nemici e ola todos.

Url delle notizie