Notizie AI del 27 Giugno 2026

Ola todos! ecco le notizie dedicate al mondo IA del 27 Giugno 2026OpenAI ha svelato GPT-5.6: SOL, TERRA e LUNA. Sol Ultra segna novantuno punto nove percento su TerminalBench due punto uno, superando Claude Mythos cinque.Sol costa cinque dollari in input e trenta in output per milione di token. Terra offre prestazioni da GPT-5.5 a metà prezzo. Luna è il più economico della famiglia.Introduce max reasoning e ultra mode con subagent per accelerare lavori complessi. Disponibile in anteprima limitata tramite Codex e API.Sam Altman conferma: rilascio graduale su richiesta del governo USA, ma puntano all’accesso generale appena possibile.Nel frattempo, gli Stati Uniti hanno revocato il ban su Claude Mythos cinque di Anthropic. Il modello ora può essere distribuito a oltre cento istituzioni USA.Passiamo a OpenHuman. Trentatremila stelle su GitHub in meno di un mese. La nuova feature si chiama Super Context: prima di rispondere esegue una scansione automatica del tuo lavoro, schermo e contesto personale. Vive a livello sistema operativo e si integra con centodiciotto app. Tutto locale, niente cloud.Sempre su GitHub, ho trovato OpenMontage. Tremila stelle in un giorno. Workflow per produzione video completa: dodici pipeline strutturate, cinquantadue strumenti, cinquecento skill per agenti. Descrivi il video in linguaggio naturale e il sistema gestisce ricerca, script, generazione asset e montaggio. Rendering con Remotion e HyperFrames. Open source.Alibaba ha mostrato Wan Streamer: agenti IA che vedono, ascoltano e rispondono in video in tempo reale. Non è più solo voice mode, è interazione visiva sincrona.Vale la pena menzionare Gemma quattro dodici B. OsaurusAI ha ottimizzato il tool calling: sessanta percento più veloce on-device, con precisione affidabile anche su modelli piccoli.Arriva anche ced punto cpp: motore C++ che identifica suoni in cinquantacinque millisecondi su CPU. Niente Python. Basato sul tagger audio CED di Xiaomi. Due volte più leggero, stesso risultato numerico. Perfetto per dare orecchie ai tuoi LLM.Microsoft ha rilasciato bitnet punto cpp come open source: framework di inferenza a un bit. Esegui modelli da cento miliardi di parametri su CPU senza GPU. Sei punto diciassette volte più veloce, ottantadue punto due percento meno energia.Zhipu offre venti milioni di token gratuiti per usare GLM-5.2: settecentocinquantasei miliardi di parametri, licenza MIT, ottimizzato per coding agenti. Un milione di token di contesto. API compatibile OpenAI. Disponibile su bigmodel e su OpenRouter per utenti internazionali. Niente carta di credito, niente abbonamento.Per GLM-5.2, il framework RL dietro al suo post-training è open source. Si chiama slime. Tiene un solo kernel RL fisso e sposta tutta la variabilità nella generazione dati. Ha addestrato l’intera serie GLM, da quattro punto cinque a cinque punto uno, in circa due giorni. Battle-tested su Qwen tre, DeepSeek V tre, Llama tre.Ornith uno punto zero ha segnato settantasette punto cinque su TerminalBench. Post-trained su Qwen tre punto cinque e Gemma quattro. Quattro varianti: nove B denso, trentuno B denso, trentacinque B MoE, trecentonovantasette B MoE. Licenza MIT.Cloudflare Workers AI ora ospita GLM-5.2: contesto da duecentosessantaduemilacentoquarantaquattro token, tool calling nativo, compatibilità OpenAI. Diecimila neuroni gratis al giorno senza carta di credito.Da segnalare anche Memanto: memoria infinita per Claude Code, Cursor, Codex. Open source, mille stelle su GitHub. Guarda il contesto completo delle sessioni, organizza e comprime con IA, recupera in novanta millisecondi. Solo pip install memanto.MemPalace ha raggiunto quarantanovemila stelle. Organizza la memoria in una struttura a palazzo: persone e progetti hanno ali, argomenti hanno stanze. Novantasei punto sei percento di recall su LongMemEval senza API, senza LLM, senza cloud. Con pipeline ibrida arriva a novantotto punto quattro percento. Ventinove strumenti MCP. Storage verbatim, niente riassunti. Python tre punto nove più ChromaDB. Licenza MIT.Cognee uno punto zero: centocinquanta miliardi di token di contesto. Centoquarantacinque percento meglio di Opus quattro punto otto e GPT cinque punto cinque sul retrieval. Si collega agli agenti già esistenti su qualsiasi piattaforma e li rende sei punto nove volte più economici. Cold start in trecentocinquanta millisecondi, ricerca in duecentosessanta.Interessante anche codebase-memory: indicizza il kernel Linux, ventotto milioni di righe, in tre minuti. Il tuo repo in secondi. Trasforma l’intera codebase in un grafo di funzioni, file e dipendenze. Dieci volte meno token su query strutturali, ottantatré percento di qualità su task complessi, due punto uno volte meno chiamate tool. Benchmarkato su trentuno repo reali.Nel frattempo, Hermes Agent ha integrato i preset MOA di Nous Research. Mixture of Agents: più modelli reference offrono consigli privati, un aggregator decide e agisce. I reference non hanno accesso a tool, solo l’aggregator risponde.Anthropic ha pubblicato frontend-design: skill ufficiale per Claude. Forza il modello a scegliere una direzione estetica prima di scrivere codice. Brutalista, editoriale, retro-futurista, lujoso, maximalista. Genera HTML, CSS, JS, React o Vue production-ready. Seicentomila installazioni, centocinquantacinquemila stelle su GitHub. Funziona in Claude Code, Cursor, Codex, Gemini CLI, OpenCode e oltre.Un ingegnere senior di Anthropic ha pubblicato un PDF di undici pagine sul Loop Engineering. La svolta: non prompt l’agente, costruisci il sistema che lo prompta per te. Il loop autonomo include discover, isolate, verify, persist, schedule. Un secondo agente rivede il lavoro. Mai auto-valutazione. Scrive su disco, non in finestre temporanee. Esegue su timer automatico.Un altro ingegnere ha rilasciato un video di ventotto minuti su come scrivere prompt efficaci per Claude Code. Copre più contenuti di corsi da trecento dollari nei primi cinque minuti.Anthropic ha anche pubblicato un PDF su come i loro team usano Claude Code: engineering, security, growth, design. Spec rarr Dispatch rarr Verify rarr Systemize. Gli ingegneri non scrivono più codice, configurano il sistema e revisionano l’ottanta percento che Claude spedisce da solo.CyrilXBT ha reso open source un framework completo per Loop Engineering. Triage giornaliero, sweep CI, aggiornamenti dipendenze, bozze changelog. Tutto su schedule con verifica integrata.Sakana AI e KPMG hanno lanciato CoffeeBench: benchmark per valutare capacità di gestione economica a lungo termine di agenti LLM. Simula un supply chain nel settore caffè con sei aziende: agricoltori, torrefattori, negozi. Ogni azienda è gestita da un agente LLM. Novanta giorni di negoziazioni, ordini, gestione inventario. Obiettivo: massimizzare profitto netto. Presentato a ICML duemilaventisei Workshop Failure Modes in Agentic AI.Sul fronte multi-agent, oltre cento agenti hanno collaborato per una settimana e accelerato Gemma quattro su vLLM di cinque volte. Hanno sviluppato autonomamente norme di comunicazione, pooling di quote, divisione del lavoro computazionale, debug kernel cross-agent. Assomiglia a osservare una comunità di ricerca IA crescere da zero.Hermes Agent più Gemini tre punto cinque Flash più Computer Use via trycua. Apre Chrome, naviga su ChatGPT, genera un’immagine. Un minuto e quarantasette secondi per inviare richiesta, trenta secondi dopo generazione per analizzare e rispondere. Esclude il tempo di generazione di ChatGPT.AI Engineering Hands-on è una collezione pubblica di notebook GitHub per imparare AI engineering da fondamenti fino a PyTorch, reti neurali, transformer, RAG, OCR. Path strutturato con Jupyter notebook ordinati, file requirements, cartelle per argomenti applicati. Inizia da funzioni, derivate, vettori, gradienti, algebra lineare, probabilità, statistica. Licenza MIT. Open source.Un ricercatore ha pubblicato su SIGGRAPH duemilaventisei due lavori con una sola RTX tremila novanta Ti e zero budget: InfiniteDiffusion per generazione immagini infinite con accesso casuale, riproducibile, parallelizzabile, zero storage. Terrain Diffusion: primo generatore procedurale di terreni basato su learning. Su singola scheda, nove volte più veloce del satellite, un punto cinque GB di VRAM. Già disponibile come mod Minecraft. Codice open source.NVIDIA ha rilasciato LocateAnything-3B: modello di localizzazione visuale. Decine di oggetti sovrapposti, li identifica tutti senza mancarne uno. Open source.Spostiamoci su 3DREAL di fal: IC-LoRA per LTX-due punto tre. Trasforma render 3D, CG o di gioco in video fotorealistici di qualità cinematografica mantenendo composizione e camera move esatti usando il primo frame. Open source.Un team ha portato da zero su GGML il tagger audio CED di Xiaomi: ced punto cpp. Identifica suoni in cinquantacinque millisecondi su CPU. Stesso risultato numerico del PyTorch originale ma più veloce e metà peso.Colpo a sorpresa da Yong Su di Google: ha portato il demo WebGL Water di Evan Wallace su Three punto js. Simulazione acqua in tempo reale, ray tracing per riflessione e rifrazione, caustics, galleggiabilità, interazione con oggetti.FreeLLMAPI aggrega i tier gratuiti di sedici provider LLM dietro un singolo endpoint. Un punto sette miliardi di token al mese. Un client library OpenAI, un URL. Router automatico sceglie il modello migliore, failover su rate limit, tracciamento uso per chiave. Oltre cento modelli: Gemini due punto cinque Flash, Llama quattro, Qwen tre duecentotrentacinque B, GPT-quattro punto uno, GPT-quattro o, Mistral Large tre, Codestral, Command R plus, DeepSeek V quattro Flash. Self-hosted, licenza MIT.Chiudiamo con un agente di sicurezza offensiva con oltre settemilatrecento skill di sicurezza actionable. Pentesting autonomo basato su MITRE ATT&CK duemila più test atomici, CIS Benchmarks millecinquecento più controlli, OWASP, NIST. Open source.Trovate i link di queste notizie altri link interessanti sul mio sto ziobuddalabs punto itSalvate il video così da non perderlo, seguitemi sui miei canali social e sul nuovo podcast su spotify e mannaggia a voi se ancora non lo state facendo, condividete il video con amici e nemici e ola todos.