Ola todos! ecco le notizie dedicate al mondo IA del 02 Giugno 2026Qualcuno ha creato una piattaforma di gaming completamente generativa. Zero codice. I modelli gestiscono tutto. Crei un gioco da una frase. Il world model genera i frame in tempo reale mentre giochi. Personaggi che ti vedono, reagiscono, parlano. Definisci le regole in inglese: obiettivi, oggetti, vittoria, sconfitta.E poi c’è una valanga di repository GitHub che stanno esplodendo.AutoHedge: un hedge fund autonomo in Python con quattro agenti AI. Un direttore genera tesi di investimento, un quant le valida, un risk manager decide la dimensione della posizione, un agente di esecuzione piazza gli ordini. Opera live su Solana. Con pip install dash U autohedge, puoi iniziare a tradare immediatamente.Vibe dash Trading: sistema di trading con modello DAG. Sessantaquattro skill finanziarie, ventinove sciami di agenti specializzati preimpostati. Analisi Ichimoku, Elliott Wave, SMC, Black dash Scholes, Greeks completi, risk parity. Il crypto desk fornisce heatmap di liquidazione e tracking degli unlock di token. Osservi gli agenti dibattere strategie in tempo reale.Fincept Terminal: un sostituto del Bloomberg Terminal che gira sul tuo laptop. Analytics CFA livelli uno, due e tre. Oltre venti agenti AI investitori come Buffett, Dalio, Soros. Più di cento connettori dati: Polygon, World Bank, IMF. Bloomberg costa ventiquattromilapunto zero dollari l’anno. Questo è gratuito.LibreChat: ogni modello che gira su ChatGPT, più Claude, Gemini, DeepSeek e altri venti. Self dash hosted. Supporto MCP nativo. Possiedi i dati, la cronologia, l’infrastruttura. OpenAI addebita venti dollari al mese per usare il loro wrapper. Questo non costa nulla.Open Higgsfield AI: uno studio cinematografico self dash hosted con oltre duecento modelli AI. Flux, Midjourney, Sora, Kling, Veo, GPT dash 4o, SDXL tutti in un’unica interfaccia. Text to image. Image to video. Modalità cinema con controlli camera professionali. Nessun abbonamento. I tuoi dati restano locali.Open dash LLM dash VTuber: un compagno AI Live2D che gira offline, vede il tuo schermo, sente la tua voce, non dimentica mai. I pensieri interni appaiono come un layer di testo separato, quindi guardi il ragionamento accadere prima che escano le parole. Modalità pet lo fa fluttuare sul desktop. Cambi l’LLM con una riga di config.Claude Ads: una skill gratuita per Claude Code che esegue centonovanta controlli di audit su Google, Meta, YouTube, LinkedIn, TikTok e Microsoft Ads. Sei subagent paralleli che sparano contemporaneamente. Consolida in un unico Ads Health Score classificato per impatto sul fatturato.Agentic Inbox: Cloudflare ha appena rilasciato come open source un client email dove un agente AI legge la tua inbox e redige le tue risposte. Gira interamente su Cloudflare Workers. Ogni mailbox vive nel proprio Durable Object. La tua email non lascia mai il tuo account Cloudflare. Un clic lo distribuisce.Camofox Browser: un browser headless open source che rende gli agenti AI invisibili al rilevamento bot. Falsifica proprietà del navigator, WebGL, AudioContext e WebRTC a livello C più più. Il browser non sembra modificato perché genuinamente non lo è. L’output dell’albero di accessibilità riduce il costo token del novanta percento.Hyperframes: HeyGen ha rilasciato come open source un framework video che fa tutto ciò che fa Remotion senza React, senza JSX, senza insegnare al tuo agente AI un nuovo formato. L’agente scrive HTML. Il framework renderizza MP4. GSAP, Lottie e Three punto js funzionano tutti. Lo stesso HTML produce sempre lo stesso file.E a proposito di strumenti creativi, Tencent Hunyuan ha rilasciato Hy dash Memory: un plugin di memoria costruito specificamente per agenti collaborativi a lungo termine come OpenClaw. Più di uno strumento di recupero, diventa il vero ‘Secondo Cervello’ del tuo agente. Basato su framework di memoria a sei layer per sistema uno slash sistema due dual system per catena evolutiva a tre layer. Risolve la frammentazione della memoria. Oltre settanta percento di memorie in meno. Oltre quarantacinque percento di densità informativa maggiore per memoria. Trentacinque percento di utilizzo token in meno su contesti ultra dash lunghi. Venti percento più veloce negli aggiornamenti di memoria.E poi c’è MiniMax M3: il primo modello open dash weights a combinare tre capacità di frontiera. Coding e Agentic Frontier: cinquantanove punto zero percento su SWE dash Bench Pro, sessantasei punto zero percento su Terminal Bench due punto uno, trentaquattro punto otto percento su SWE dash fficiency, ventotto punto otto percento su KernelBench Hard, settantaquattro punto due percento su MCP Atlas. MiniMax Sparse Attention scala il contesto a un milione. Nativamente multimodale dal passo zero. I pesi e il report tecnico usciranno tra circa dieci giorni.Qualcuno ha rilasciato come open source un parser PDF che converte cento pagine al secondo in Markdown. CENTO PAGINE AL SECONDO. Su CPU. Senza GPU. Senza cloud. Senza chiave API. Gestisce tabelle, layout annidati, documenti complessi. OCR integrato per oltre ottanta lingue via modalità ibrida. Integrazione ufficiale LangChain. Si chiama OpenDataLoader e ha appena preso il posto numero uno in ogni benchmark PDF dash to dash Markdown.Passiamo a una nuova infrastruttura browser. Tre dash sei volte più economica del resto. VM Firecracker personalizzate. Fork Chromium personalizzato. Bare metal. Zero punto zero due dollari l’ora, il più economico del pianeta. Si avvia in meno di un secondo. Diecimila browser concorrenti. Numero uno in stealth.E NVIDIA non è da meno. Ha annunciato DGX Station per Windows, il supercomputer AI deskside più potente al mondo con Windows alimentato da NVIDIA GB300. Esegui modelli AI di frontiera con fino a un trilione di parametri localmente. Costruisci ed esegui agenti AI sicuri su Windows con NVIDIA OpenShell. Costruito da ASUS, Dell, GIGABYTE, HP, MSI e Supermicro.Sempre nel mondo NVIDIA, qualcuno ha vinto l’hackathon di Anthropic e ha rilasciato come open source il suo intero set di sviluppo Claude Code. Centoottantatré agent skills. Quarantotto sub dash agents. Settantanove ready dash made commands. Funziona con Claude Code, Codex, Cursor, Gemini e OpenCode. Si chiama ‘Everything Claude Code’, licenza MIT per uso commerciale.E ancora NVIDIA. SANA dash Streaming: editing video in tempo reale ad alta risoluzione tramite DiT ibrido. Milleduecentoottanta per settecentoquattro, ventiquattro fps. Gira su RTX 5090, cinque punto cinquantasei GB VRAM. Distillazione a quattro passi più decodifica VAE causale. Tre punto sette volte più veloce rispetto alle baseline all dash softmax. RTX Spark dovrebbe rendere possibile il quattro K in tempo reale.Restando su NVIDIA, hanno rilasciato un modello text dash to dash image open weights che sembra seriamente competitivo, come parte del rilascio di Cosmos 3. E poi SANA dash Streaming per editing video v2v in tempo reale.Passiamo a Cosmos 3: la prima famiglia di world model omnimodali open weights di NVIDIA. Progettata per elaborare e generare congiuntamente linguaggio, immagine, video, audio e sequenze di azioni all’interno di un’architettura mixture dash of dash transformers unificata. Classificato come modello open source numero uno Text2Image e Image2Video da Artificial Analysis, e come modello di policy robotica numero uno da RoboLab e RoboArena. Rilasciati varianti Super trentadue B e Nano otto B.E sempre NVIDIA ha annunciato il primo design di riferimento robotico umanoide open costruito per la ricerca robotica. NVIDIA Isaac GR00T Reference Humanoid Robot combina il robot umanoide Unitree H2, mani Sharpa Robotics Wave a cinque dita per manipolazione destrorsa, calcolo onboard Jetson Thor e software e modelli open Isaac GR00T.Runway si unisce alla Cosmos Coalition: una nuova iniziativa globale con NVIDIA e laboratori AI leader per costruire e rilasciare come open source world model di frontiera per Physical AI. Runway entra come membro fondatore, lavorando al fianco di NVIDIA e un insieme di laboratori AI leader.E a proposito di Physical AI, VAST AI Research ha presentato Project Eden: un world model persistente e multiplayer che rompe fondamentalmente con i paradigmi esistenti disaccoppiando lo stato del mondo sottostante dal rendering visivo. Invece di trattare il mondo come una sequenza di frame transitori, Eden lo tratta come un ambiente strutturato ed evolutivo che gira continuamente, può essere modificato dalle azioni dell’utente e può essere osservato coerentemente da qualsiasi punto di vista.E poi c’è Keye dash VL due punto zero dash trenta B dash A tre B disponibile su ModelScope. Porta l’architettura DeepSeek Sparse Attention nel mondo multimodale. Finestra di contesto da duecentocinquantaseimila token. Processa video di un’ora senza degrado. Prestazioni da modelli oltre duecento miliardi, costo di prefill dimezzato.Google Antigravity si sta trasformando in una workbench scientifica. Il nuovo pacchetto Science Skills consente ai ricercatori di eseguire workflow complessi come analisi proteica in minuti usando modelli Alpha asterisco specializzati e oltre trenta database scientifici principali.Passiamo a un nuovo modello multimodale agent da Alibaba. Qwen3.7 dash Plus: un modello che unifica visione e linguaggio in un’unica base agente versatile. Agente ibrido interattivo multimodale: operazione GUI e CLI unificata su task visivi e testuali. Coding agent versatile e assistente produttività con input full dash modality. Visual Agent: percezione, ragionamento, grounding e QA search dash augmented. Generalizzazione cross dash harness su diversi framework agente. Ora disponibile via API su Alibaba Cloud Model Studio.E ByteDance ha appena rilasciato Bernini su Hugging Face. Genera o modifica video da testo, immagini o riferimenti. Rivaleggia con i migliori modelli closed dash source là fuori.E sempre ByteDance ha rilasciato come open source Bernini: un nuovo framework AI di generazione ed editing video. Modifica video con prompt testuali. Riferimenti immagine slash video. Codice disponibile.E qualcuno ha creato uno studio d’arte di gioco AI open source che genera interi pacchetti di asset 2D, personaggi, animazioni, sprite sheet, tutto. Gli sviluppatori di giochi passavano settimane su questo.Mellum rilascia Mellum2: il loro primo LLM ‘serio’. Dodici B A due punto cinque B MoE LLM pre dash addestrato su circa undici T token e post dash addestrato con RLVR. Rilasciano checkpoint base slash SFT slash RL insieme a un report tecnico.E qualcuno ha pubblicato MOSS dash SoundEffect v due punto zero: genera effetti sonori di qualità ultra dash alta con AI. Un modello Text dash to dash Audio all’avanguardia che genera suono di qualità ultra dash alta a quarantotto kHz da prompt testuali fino a trenta secondi. Dal suono di digitazione della tastiera ai suoni ambientali realistici, output a livello professionale. Supporta anche addestramento aggiuntivo personalizzato.E VAST AI Research ha presentato TripoSplat: un modello completamente open source sotto licenza MIT che converte una singola immagine 2D in Gaussian 3D di alta qualità. Progettato come potente strumento pipeline per creazione asset, AR slash VR, sviluppo giochi, ambienti di simulazione e altro.E ora una serie di aggiornamenti più tecnici.AirLLM usa ‘layer dash wise inference’. Invece di caricare l’intero modello, carica, calcola e scarica un layer alla volta. Puoi ora eseguire LLM da settanta B su una GPU da quattro GB.Unsloth ha realizzato una guida sull’uso di MCP con LLM locali. Connetti Qwen3.6 e Gemma 4 per accesso controllato a strumenti, file, API, abilitando workflow automatizzati privati.GSAP ufficiale ha rilasciato come open source gsap dash skills, progettato specificamente per fornire capacità di animazione professionale e capacità di progettazione estetica per strumenti AI come Cursor, Claude, Copilot. La lacuna dell’animazione frontend AI finalmente colmata completamente.E poi c’è Scrapling su GitHub che ha raccolto cinquantasei punto sette k stelle. Un framework di scraping davvero moderno per il 2026, scrivi una volta, stabile per sempre, auto dash riparazione intelligente.E NVIDIA ha annunciato RTX Spark: il loro primo chip PC di sempre. RTX 5070 livello GPU. Centoventotto GB memoria unificata. Un petaflop di AI locale. Sottile, leggero, appena throttle scollegato. Il tuo agente AI vive sulla macchina. Ventiquattro slash sette. Nessun cloud. Uscita autunno 2026.E qualcuno ha creato Godot: un motore di gioco completamente gratuito per costruire giochi 2D e 3D completi, spedirli ovunque e mantenere il cento percento di ogni dollaro che mai guadagni. Centoundici k stelle. Licenza MIT.E un singolo file punto md Claude ha appena raggiunto il numero uno su GitHub Trending. Quarantaquattro k stelle. Sette giorni. Zero dipendenze. Corregge le peggiori abitudini di codifica degli LLM usando quattro principi.E ComfyUI ha integrato undici nuovi modelli a maggio che spaziano tra immagine, 3D, audio, video e multimodale. I punti salienti: Krea 2 per generazione immagini style dash first. VOID di Netflix rimuove oggetti e tutto ciò che hanno causato: ombre, riflessioni, interazioni fisiche. Apache 2.0. Tripo 3.1 più TripoSplat: un’immagine a un asset 3D Gaussian completo, end to end.E qualcuno ha creato un video usando GPT Image 2.0 e Kling 3.0. Ha anche testato Seedance 2.0 e Google Omni. Sono molto più veloci per generare video di trasformazione, ma nei suoi test c’erano spesso uno o due scatti che sembravano leggermente innaturali o avevano quell’inconfondibile aspetto generato dall’AI.E PewDiePie ha appena rilasciato Odysseus: quindicimila stelle su GitHub in meno di ventiquattro ore. Una specie di ChatGPT slash Claude, ma pensato per essere usato con AI locale. Ha agenti con strumenti, MCP, file e memoria. Funziona su Windows, macOS e Linux.E qualcuno ha rilasciato Hermes Desktop: un’app desktop gratuita che fornisce un’interfaccia decente a Hermes Agent. Un unico posto per tutto. Installazione e configurazione automatiche, nessun terminale necessario. Chat in streaming con tracciamento token. Profili agente multipli. Memoria che puoi davvero vedere e modificare. Quattordici categorie di strumenti inclusi web, browser, generazione immagini e audio. Scheduler per attività automatiche. Sedici gateway di messaggistica inclusi Telegram, WhatsApp, Discord, Slack e Signal.E MiniMax M3 ha trasformato uno schizzo su tovagliolo in un gioco giocabile. Hanno dato a MiniMax M3 una bozza disegnata a mano di un platformer stile Doodle Jump. Ha letto gli elementi dalla bozza, scritto la logica, disegnato l’interfaccia e spedito come un gioco HTML autonomo. Input: seimilanovecentoventi token. Output: novemilanovecentotrentatré token. Costo: zero punto zero due otto dollari.Trovate i link di queste notizie e altri link interessanti sul mio sito ziobuddalabs punto itSalvate il video così da non perderlo, seguitemi sui miei canali social e sul nuovo podcast su spotify e mannaggia a voi se ancora non lo state facendo, condividete il video con amici e nemici e ola todos.