Notizie AI del 07 Giugno 2026

Ola todos! ecco le notizie dedicate al mondo IA del 07 Giugno 2026Google ha rilasciato Gemma 4 12B QAT. Dodici miliardi di parametri, gira su schede da otto gigabyte di VRAM. TRENTA tok al secondo con sessantaquattromila di contesto. Versione standard? Quindici. Il QAT è più piccolo ma più veloce. Addestrato per essere quantizzato.NVIDIA ha pubblicato Nemotron tre punto cinque ASR. Seicento milioni di parametri, oltre quaranta lingue, funziona in streaming. Un progetto chiamato parakeet punto cpp lo esegue su CPU normale. Due volte e mezzo più veloce del runtime ufficiale, stesso output.Passiamo a MiniMax M3. Hanno dato lo stesso codice a M3 e a Claude Opus quattro punto otto. Diciassette bug piantati. M3 ne ha trovati tredici per sette centesimi. Claude tredici per un dollaro e trenta. Stessa precisione, costo diverso.Nel frattempo, Google Research ha rilasciato TurboVec. Comprime dieci milioni di vettori da trentuno gigabyte a quattro. Ricerca più veloce di FAISS. Kernels SIMD ottimizzati, si aggiorna online senza rebuild. Open source.Da segnalare anche Maple. Trasforma i dati di telemetria in una mappa di servizi interattiva in tempo real. Visualizzi API, database, code di messaggistica. Metriche live su latenze e tassi di errore. Architettura basata su Effect, server MCP integrato.Vale la pena menzionare whichllm. Strumento da riga di comando che analizza la tua GPU e ti dice quali modelli puoi far girare. Confronta benchmark reali, velocità di inferenza e quantizzazione. Una sola riga di codice.Sempre attivo, NVIDIA ha lanciato un modello con un milione di token di contesto. Open model, tier gratuito senza costo per token, gira su hardware locale. Codebase intere in un singolo prompt.Non si ferma Liquid AI. Due nuovi modelli giapponesi: LFM due punto cinque Audio uno punto cinque B e LFM due punto cinque uno punto due B. Il primo è end-to-end per voce, quindici miliardi di parametri. Supera J-Moshi da settantasette miliardi.Arriva anche PDFCraft. Centotrentuno strumenti per PDF. Merge, split, compressione, conversione, crittografia. Seimila stelle su GitHub. Tutto locale, tutto gratis.Occhio a CVE MCP Server. Ventisette tool di sicurezza, ventuno fonti di intelligence. Lookup CVE, EPSS, CVSS, KEV, CWE. Mapping MITRE ATT&CK. Integrazione VirusTotal e Shodan. Tutto attraverso MCP.Si parla di OpenWiki. Copi testo, immagini o link, il desktop salva automaticamente. AI riorganizza tutto, crea wiki, genera mappe di conoscenza. Dati locali, export in Markdown. Supporta MCP.Interessante anche Hermes Agent zero punto sedici. App desktop native per macOS, Windows, Linux. Dashboard web completa. Gestisci canali, server MCP, credenziali. Integrazione NVIDIA Skills Hub. Supporto cinese semplificato.Sul fronte vocale, mlx-audio zero punto quattro punto quattro. Quindici nuovi modelli TTS, ASR, VAD. VoxCPM2 da due miliardi, quarantotto kilohertz, trenta lingue. Mega-ASR con routing LoRA. Tutto su Apple Silicon.Novità anche da Anthropic. È comparso uno slug per Claude Mythos cinque in dev mode. Mythos sarà una classe di modelli separata da Haiku, Sonnet e Opus.Spostiamoci su GPT. Un nuovo checkpoint GPT cinque punto sei chiamato kindle-alpha è in test interno. Frontend generation migliorata. Vision più forte. Output complessivo di qualità superiore. Rilascio previsto entro il mese.Chiudiamo con Mac-1. Modello da sei punto sei miliardi di parametri, gira su qualsiasi Mac. Sette gigabyte di RAM minimi, dodici consigliati. Usa quattrocentottantasette strumenti nativi macOS. Task multi-tool. Sessantacinque tok al secondo.Trovate i link di queste notizie altri link interessanti sul mio sto ziobuddalabs punto itSalvate il video così da non perderlo, seguitemi sui miei canali social e sul nuovo podcast su spotify e mannaggia a voi se ancora non lo state facendo, condividete il video con amici e nemici e ola todos.