Notizie AI del 15 Giugno 2026

Ola todos! ecco le notizie dedicate al mondo IA del 15 Giugno 2026AMD ha fatto un colpo di scena. Lisa Su è salita sul palco con un mini PC del volume di un libro. Al suo interno un Ryzen AI Max+ 395 con 128 GB di memoria unificata. Su Linux il GPU può accedere a circa 110 GB. Il modello Qwen3 235B gira completamente, senza quantizzazione. ZERO cloud. ZERO fee per token. Tutto sulla scrivania. Il prezzo: circa duemila dollari una tantum. L’elettricità: nove dollari al mese. Confronto diretto con abbonamenti Claude Code o ChatGPT che costano centinaia di dollari mensili.Passiamo a Zvec. Alibaba ha aperto il codice di un database vettoriale che gira direttamente dentro la tua app. Niente server. Niente configurazione. Niente bolletta da duecento dollari al mese. Ricerca miliardi di vettori in millisecondi. Testato in produzione dentro Alibaba. pip install zvec e sei pronto.Nel frattempo, Zhipu ha rilasciato GLM 5.2. Disponibile per gli utenti del piano Coding. ZCode 3.0 integra il modello con agenti più capaci, gestione del contesto lungo e una funzione Goal per obiettivi complessi. Chi si abbona riceve cinquanta percento di quota in più dentro ZCode. I nuovi utenti ottengono cinque giorni gratis con cinque milioni di token al giorno.Sempre nel mondo AI, si parla di Open-Generative-AI. Piattaforma open source che integra oltre duecento modelli generativi. Immagini, video, sincronizzazione labiale, controllo cinematografico. Nessun filtro di contenuti. Output locale a 1080p. Modalità locale più cloud. App desktop per macOS, Windows e Linux. Licenza MIT.Da segnalare anche Memanto. Dà memoria infinita a Claude Code, Codex e Cursor. Salva il contesto delle sessioni di lavoro. Lo comprime e organizza con IA. Recupera informazioni rilevanti in meno di novanta millisecondi. Funziona con LangGraph, CrewAI e altri framework. Niente database vettoriali. Niente configurazione complessa. Un comando e il tuo agente ricorda tutto. Già oltre cinquemila stelle su GitHub. Completamente gratuito e open source.Occhio a OpenDataLoader PDF. Parser per PDF pensato per pipeline RAG. Centosedici volte più veloce di Marker. Punteggio complessivo su benchmark 0.907. Tabelle, formule, immagini, grafici e OCR per oltre ottanta lingue. Output in Markdown, JSON o HTML. Integrazione nativa con LangChain. Gira su CPU locale. Ogni pagina richiede 0.46 secondi. Licenza Apache 2.0. Ventiquattromila stelle su GitHub.Vale la pena menzionare Agent-Reach. Progetto open source che permette agli agenti IA di navigare Twitter, Reddit, GitHub, YouTube e oltre dieci altre piattaforme. Tutto senza pagare API. Nessun limite di rate. Installazione: pip install agent-reach. Compatibile con Claude Code, Cursor, Aider, LangChain. Oltre ventitremila stelle su GitHub. Licenza MIT.MIT ha pubblicato un paper che ribalta l’approccio ai context window. Invece di forzare tutto nel contesto, il documento viene salvato come variabile Python esterna. L’IA scrive codice per cercare esattamente quello che serve. Usa espressioni regolari. Naviga la struttura. Spawna sub-istanze in parallelo per analizzare sezioni specifiche. Risultato: gestione di input fino a dieci milioni di token. Cento volte oltre il window nativo. Costo per query: comparabile o inferiore alle chiamate con contesto enorme. Il codice è su GitHub. Open source.Arriva anche Headroom. Creato da un ingegnere di Netflix. Comprime tutto quello che l’agente IA legge prima che raggiunga il LLM. Output di tool, log, file, chunk RAG, risultati di ricerca codice, cronologia conversazioni. Risparmio dichiarato: sessanta-novantacinque percento di token. Nessuna perdita di qualità nelle risposte. Supporta Python, TypeScript, proxy locale, server MCP. Wrapper per Claude Code, Codex, Cursor, Aider, Copilot.Sul fronte TTS, VoxCPM2. Clona qualsiasi voce con tre secondi di audio. Trenta lingue. Qualità studio a 48kHz. Puoi descrivere la voce da testo: “voce maschile grave da locutor radiofonico” e il sistema la genera. Niente API a pagamento. Tutto locale. ElevenLabs fa pagare ventidue dollari al mese. Questo è gratis e open source.Interessante anche LibreChat. Interfaccia unica per ChatGPT, Claude, Gemini, DeepSeek e oltre venti modelli. Autoalojato. Supporto nativo per MCP. Dati e cronologia restano sulla tua infrastruttura. Usi le tue chiavi API. Niente costi aggiuntivi per l’interfaccia. Open source.Google ha aperto il codice di TimesFM. Modello per previsioni di serie temporali. Pre-addestrato su cento miliardi di punti dati reali. Previsioni zero-shot senza fine-tuning. Trend di vendita. Prezzi di mercato. Traffico utenti. Domanda energetica. Volatilità cripto.Un aggiornamento da Lucebox. Hanno rilasciato Luce KVFlash. Permette di eseguire modelli preferiti dentro Lucebox con 256k di contesto. Senza preoccuparsi di KVCache e OOM. Decodifica fino a 2.9 volte più veloce con contesto lungo. Ispirato al paging dei sistemi operativi. Usa un metodo di prefill speculativo. Consumo di VRAM del KV quasi costante. Offload dinamico di ciò che non serve.Chiudiamo con RLMs. Stesso gruppo del MIT. Invece di forzare documenti enormi nel context window, il modello naviga il documento come un esperto umano in biblioteca. Scrive codice. Cerca con regex. Taglia sezioni esatte. Spawna sub-AI in parallelo per leggere e sintetizzare. Punteggi su benchmark difficili: modelli standard crollano a zero. RLMs risolvono problemi. Guadagni a doppia cifra percentuale. Input fino a dieci milioni di token. Stesso prezzo delle chiamate standard. Il codice è su GitHub. Gratuito.Trovate i link di queste notizie altri link interessanti sul mio sto ziobuddalabs punto itSalvate il video così da non perderlo, seguitemi sui miei canali social e sul nuovo podcast su spotify e mannaggia a voi se ancora non lo state facendo, condividete il video con amici e nemici e ola todos.