Notizie AI del 13 Giugno 2026

Ola todos! ecco le notizie dedicate al mondo IA del 13 Giugno 2026Zyphra ha rilasciato ZONOS2, nuovo modello text-to-speech open source con clonazione vocale ad alta fedeltà. Il modello promette la massima espressività tra i TTS disponibili pubblicamente ed è già accessibile su Zyphra Cloud.Nel frattempo, Kimi ha lanciato K2.7-Code, il loro ultimo modello per il coding. Rispetto alla versione precedente registra un aumento del ventuno punto otto percento su Kimi Code Bench versione due e del trentuno punto cinque percento su MLS Bench Lite. Consuma il trenta percento in meno di token durante il ragionamento.Google ha presentato Gemini-SQL2, nuova capacità text-to-SQL basata su Gemini tre punto uno Pro. Ha raggiunto risultati da stato dell’arte sul benchmark BIRD, traducendo linguaggio naturale in query SQL pronte per l’esecuzione.PaddleOCR annuncia la serie PP-OCRv6 con modelli da uno punto cinque milioni fino a trentaquattro punto cinque milioni di parametri. Precisione in rilevamento aumentata del quattro punto nove percento, in riconoscimento del cinque punto uno percento. Inferenza su CPU fino a cinque punto due volte più veloce con OpenVINO.Passiamo a DiffusionGemma. Il nuovo modello a diffusione di Google genera testo quattro volte più veloce di Gemma quattro standard, ma con sei volte più errori. Test su biografia di Steve Jobs e storia di Tetris mostrano trentatré fatti corretti contro ventotto sbagliati. Google stessa consiglia di usare Gemma quattro standard quando serve precisione fattuale.Unsloth ha ottimizzato DiffusionGemma per inferenza locale: ora raggiunge oltre duemila token al secondo, uno punto otto volte più veloce della versione base. Funziona con diciotto gigabyte di RAM.Sul fronte ricerca, MIT presenta Fast KV Compaction via Attention Matching. Comprime la cache chiave-valore dei modelli fino a cinquanta volte in pochi secondi, senza perdita di qualità. Evita il lento training end-to-end costruendo cache compatte nello spazio latente.Google rilascia Open Knowledge Format: standard aperto per memorizzare informazioni in directory di file markdown. Rende semplice creare basi di conoscenza che gli agenti possono interrogare o modificare. I file si collegano tra loro e servono come wiki vivente.Sempre attivo, Higgsfield Games permette di costruire e distribuire giochi multiplayer completi da un singolo prompt. Qualsiasi genere, 2D o 3D, con personaggi, oggetti e mondi generati al volo. Alimentato da Claude Fable cinque.Da segnalare anche Flex4DHuman: modello di diffusione video che trasforma un singolo video o viste sparse da telecamere multiple in video multi-vista sincronizzati. Le viste generate possono essere ricostruite in Gaussian splat 4D per realtà aumentata, gaming e video reshooting.TestSprite rilascia la sua CLI come open source sotto licenza Apache due punto zero. Lo strumento permette agli agenti di coding di testare le applicazioni end-to-end come utenti reali, correggere errori e riverificare tutto automaticamente. Sul leaderboard pubblico l’app più corretta è stata costruita dal modello più economico del campo, a metà del costo del più costoso.Code2LoRA propone un’idea interessante: invece di riempire il prompt con il contesto del repository a ogni query, lo distilla in un adattatore LoRA. Una singola passata sullo snapshot del repository, un adattatore, zero token extra durante l’inferenza. Per codebase in evoluzione usa una GRU a singolo layer che traccia la storia dei commit. Ogni git diff aggiorna lo stato nascosto in meno di dieci millisecondi.Occhio a Agent Reach. Progetto open source con ventisei punto quattro mila stelle che permette agli agenti come Claude Code, Cursor o OpenClaw di accedere a YouTube, GitHub, Twitter, Reddit, Xiaohongshu e altre piattaforme senza API a pagamento. Gestisce automaticamente yt-dlp, GitHub CLI e altri strumenti maturi. Installazione è una sola riga di comando.Headroom comprime log, JSON e chunk RAG prima che arrivino al modello. Sessanta-novantacinque percento meno token, stesse risposte. Validato su GSM8K, TruthfulQA e SQuAD. Il benchmark più notevole: novantaquattro punto nove percento di compressione con novantotto punto due percento di recall su pagine HTML. Funziona come libreria Python, proxy HTTP o server MCP.Hermes Agent introduce template di automazione per cron job e webhook. Tre tipi di trigger: schedule per esecuzioni periodiche, GitHub event per eventi su repository, API call per servizi esterni. Tutti e tre possono consegnare su Telegram, Discord, Slack, SMS, email, commenti GitHub o file locali. I template includono triage notturno backlog, code review automatico su PR, rilevamento drift documentazione e audit di sicurezza dipendenze.Interessante anche Trellis, framework di ingegneria per agenti di coding. Stabilisce un sistema di memoria a livello progetto in una directory punto trellis che contiene specifiche, PRD, contesto di implementazione e log di revisione. Il tutto versionato con il codice. Supporta Claude Code, Codex, Cursor, OpenCode e altri quattordici sistemi.Anthropic ha pubblicato un workshop di ventisette minuti su come scrivere prompt efficaci per Claude. Insegnato dal team che ha costruito il modello. Gratuito, senza registrazione o paywall. Copre aspetti che molti corsi a pagamento non toccano.Valigo ha chiesto a Claude cinque Fable high di creare un clone di Skyrim. In venti minuti, un solo tentativo, ha prodotto dungeon, creazione personaggio, suoni, dialoghi e cutscene.ammaar ha chiesto a Claude Fable cinque di effettuare reverse engineering di un gioco DOS del millenovecentonovantatré senza codice sorgente. Ha letto il codice macchina grezzo, riscritto il motore in C e fornito un port completamente modificabile per ogni piattaforma. Trenta minuti da EXE a iPhone.MoneyPrinterTurbo automatizza la creazione di short video. Input: una parola chiave. Output: script completo, materiale video ad alta definizione senza copyright, sottotitoli, voiceover, musica di sottofondo. Supporta formato verticale nove-sedici e orizzontale sedici-nove. Oltre un milione e trecentomila stelle su GitHub.Qiaomu-anything-to-notebooklm converte articoli WeChat, video YouTube, podcast, PDF, Word, Excel ed ebook in podcast, presentazioni e mappe mentali. Tutto tramite linguaggio naturale, senza scrivere codice.Per chi fa ricerca accademica: academic-research-skills fornisce a Claude Code capacità per gestire l’intero ciclo di pubblicazione scientifica. Ricerca profonda su arXiv, Semantic Scholar e DBLP. Drafting sezione per sezione. Verifica completa di riferimenti e dati. Peer review simulata con cinque revisori più Devil’s Advocate. Export in APA, IEEE, Chicago, MLA e Vancouver.Un ricercatore ha reso disponibile gratuitamente online il textbook completo su algoritmi di pianificazione. Ottocentoventisei pagine pubblicate da Cambridge University Press. Copre motion planning, pianificazione sotto incertezza, sensor-based planning, teoria dei giochi, reinforcement learning e sistemi nonholonomic. Nessun login richiesto.Sul fronte hardware consumer: laptop gaming da novecentodollari con otto gigabyte VRAM e sedici gigabyte RAM fa girare Hermes Agent Desktop App più Gemma quattro ventisei B A4B QAT MTP con llama punto cpp. Venti token al secondo in decode, duecento in prefill. Tool call funzionano senza allucinazioni.Mac Mini M4 più Ollama più Claude Code sostituisce uno stack di subscription da quattromilanovecento dollari l’anno con hardware da cinquecentonovantanove dollari. Costo elettricità mensile: tre dollari. Saving annuale: oltre cinquemiladuecento dollari.Un utente ha consegnato a Hermes Agent la sua intera attività per tre settimane. Si è svegliato con analisi competitive completate, report di intelligence e stato progetto mai compilato manualmente. Il sistema ha rilevato uno shift di posizionamento competitivo durato sei settimane che era completamente sfuggito.OpenCut è una copia open source di CapCut. Editing video senza watermark, senza subscription, senza funzioni bloccate. Oltre cinquantacinquemila e quattrocento stelle su GitHub. Compatibile con web, desktop e mobile.LibreChat fornisce una singola interfaccia per accedere a ChatGPT, Claude, Gemini e altri modelli. ComfyUI Desktop permette di generare immagini, video e modelli 3D con oltre venti modelli diversi. Entrambi completamente gratuiti e open source.Trovate i link di queste notizie altri link interessanti sul mio sto ziobuddalabs punto itSalvate il video così da non perderlo, seguitemi sui miei canali social e sul nuovo podcast su spotify e mannaggia a voi se ancora non lo state facendo, condividete il video con amici e nemici e ola todos.

Url delle notizie