Notizie AI del 31 Maggio 2026

Ola todos! ecco le notizie dedicate al mondo IA del 31 Maggio 2026Ho trovato su GitHub MarkItDown. Centomila stelle. Microsoft. Trasforma qualsiasi file in Markdown pulito. PDF, Word, PowerPoint, Excel, immagini. Tutto.Il problema vero: i documenti reali sono un inferno per i sistemi RAG. PDF caotici, Word pieni di formattazione nascosta, PowerPoint pesanti, fogli di calcolo impossibili da parsare.MarkItDown risolve. Gratuito, open source, uso commerciale permesso. Testato su un PDF da duecento pagine: Markdown perfetto in pochi secondi.E sempre su GitHub sono comparsi diversi repository dedicati a voce e audio AI. Whisper, F5-TTS, Coqui TTS, RVC, Bark, OpenVoice, Whisper punto cpp, Faster Whisper, ChatTTS. Progetti per sintesi vocale, clonazione voce, trascrizione. Tutti disponibili, tutti eseguibili localmente.E VoxCPM2 è esploso. Ventimila stelle. Sintesi vocale senza audio di riferimento. Gli descrivi la voce che vuoi, la genera. Oppure gli dai un clip: copia tono, emozione, ritmo. Accuratezza al NOVANTANOVE PERCENTO. Anche voci cantate. Qualità studio a quarantotto kilohertz. Apache due punto zero.E poi c’è un’ondata di alternative gratuite a software a pagamento.Parchis Text-to-Speech al posto di ElevenLabs. Graphite al posto di Photoshop più Illustrator. PDF-Tools al posto di Acrobat. Notesnook al posto di Notion. Docmost al posto di Confluence. Tuta al posto di Gmail. Beszel al posto di Datadog. Reactive Resume al posto di resume builder a pagamento. Shotcut al posto di editor video premium. LocalAI al posto delle API OpenAI.Tutti open source. Tutti gratuiti. Tutti funzionali.E PaGeR è arrivato. ETH più Google. Da una singola foto panoramica a trecento sessanta gradi genera una scena 3D completa. Punto cloud ad alta precisione. Record sia indoor che outdoor. La differenza più grande rispetto ai modelli precedenti si vede proprio negli esterni, dove gli altri AI collassano.E GitHub ha visto comparire settecentocinquantaquattro skill di cybersecurity mappate su cinque framework: MITRE ATT&CK, NIST CSF, D3FEND, ATLAS, AI RMF. Una base di conoscenza pronta per dare agli agenti AI workflow di sicurezza reali invece di risposte generiche. Compatibile con Claude, Copilot, Cursor, Codex, Gemini.E Google I/O ha trasformato Gemini in un sistema operativo AI. Una suite completa di strumenti che va oltre la chat.E Surya OCR è qui. Meno di un miliardo di parametri. Supporta novantuno lingue. Cinque pagine al secondo su RTX cinquemilaenovanta. Gira su CPU, GPU, MPS. OTTANTATRE PUNTO TRE percento su OlmOCR bench. Primo sotto i tre miliardi. Cento percento open source.Passiamo a GSAP-skills. GSAP, il leader delle animazioni frontend, ha rilasciato un pacchetto ufficiale per agenti AI. Oltre venticinque casi d’uso avanzati: Timeline, ScrollTrigger, Ease. Compatibile con Cursor, Claude Code, Copilot, Google Antigravity, Windsurf. Gli agenti AI possono generare animazioni fluide, professionali, di livello Apple. Gratuito, open source, cross-framework.E la settimana su GitHub ha visto dieci repository esplodere.Understand-Anything: codice trasformato in grafo di conoscenza interattivo. Esplora, cerca, interroga.Codegraph: grafi di codice pre-indicizzati per agenti AI. Meno token, meno chiamate, tutto locale.AI-engineering-from-scratch: imparalo, costruiscilo, pubblicalo.MoneyPrinterTurbo: genera video HD completi in automatico da un tema.ECC: ottimizzazione della toolchain per agenti AI.Taste-skill: impedisce agli AI di generare contenuti banali.Knowledge-work-plugins: plugin open source per Claude Cowork.Anthropic-Cybersecurity-Skills: settecentocinquantaquattro skill di sicurezza per agenti.Claude-plugins-official: catalogo ufficiale Anthropic.RuView: WiFi trasformato in intelligenza spaziale e monitoraggio vitale senza video.E Addyosmani ha rilasciato agent-skills. Skills di livello senior per agenti AI. Controlli di qualità integrati. Gli agenti sviluppano seguendo sempre lo stesso processo senza deviazioni. Quarantacinquemila stelle.E SysMocap è comparso. Sviluppatore a Hong Kong. Motion capture da webcam a personaggio 3D in tempo reale. Gratuito. Nessun account, nessun cloud. Le tute Rokoko costano duemilacinquecentonovantacinque dollari più abbonamento mensile. SysMocap usa la webcam che hai già. Supporta Windows, Mac Intel, Mac Apple Silicon, Linux. Licenza MPL due punto zero.E Anthropic ha rilasciato Frontend Design per Claude Code. Centotrentaseimila stelle. L’agente definisce prima la direzione estetica, poi genera la pagina. Niente più “gradiente viola startup”. Una sola installazione, tutte le sessioni. Compatibile con Claude Code, Cursor, Codex, Gemini CLI, OpenCode e altri. Quattrocentodiciottomila installazioni in poche settimane.E c’è un plugin ufficiale Anthropic che scansiona automaticamente il progetto e configura hooks, skills, server MCP, subagent e workflow. Il novanta percento degli utenti Claude Code non tocca metà delle funzionalità disponibili.E LongCat-Avatar è arrivato. Laboratorio cinese. Carichi una foto e un audio, esce un avatar parlante sincronizzato. Open source. Quello che prima richiedeva agenzia, videocamera e editing ora è un repository.E Recordly è qui. Quindicimilacinquecento stelle. Registra lo schermo, aggiunge zoom automatici, sistema il cursore, applica sfondi cinematici. Open source. Per chi sa programmare ma invia demo con il cursore default di Windows.E Liquid LFM due punto cinque-otto B-A uno B ha battuto GPT-oss-venti B di OpenAI sul tool calling. Test locale su MacBook Pro M5 Max, sessantaquattro gigabyte. Stessa richiesta di pianificazione viaggio: sette chiamate tool necessarie.LFM due punto cinque: quattro punto otto gigabyte RAM, sette su sette chiamate, duecentosessantasei token al secondo, sei punto nove secondi.GPT-oss-venti B: undici gigabyte RAM, tre su sette chiamate, centoquarantasei token al secondo, quindici secondi.L’otto B ha usato meno della metà della RAM e ha completato tutte le chiamate. Il venti B ne ha perse più di metà. Velocità doppia. Trentotto trilioni di token di training.E Moondream ha lanciato Segmentation. Maschere immagine con precisione pixel. Descrivi l’oggetto esatto, ottieni poligoni SVG modificabili. Non solo box. Batte Gemini e SAM 3.E ho trovato su GitHub un tool che converte libri tecnici in skills per Claude Code. Carichi un libro, estrae concetti chiave, workflow e pattern in skill riutilizzabili. Conoscenza statica trasformata in qualcosa che Claude può effettivamente usare.E qualcuno ha scritto in Python gemini-web2api. Quattrocento stelle in due giorni. Trasforma la versione web di Gemini in server compatibile OpenAI API. Nessuna dipendenza esterna. Supporta streaming, function calling, tool calling. Flash, Flash Thinking, Pro, Auto, Lite. Docker one-click. Risparmio da venti a cinquanta dollari al mese.E Microsoft sta preparando nuovi modelli per l’annuncio del due giugno.MAI Voice 2: multilingua, quindici nuove lingue, spettro emotivo più ampio.MAI Transcribe uno punto cinque: speech-to-text.MAI Image due punto cinque: già in preview su LM Arena, supporta upload file e image editing.E c’è chi ha costruito un’influencer virtuale che genera quarantasettemila dollari al mese. I brand pagano tremilaeduecento dollari a video. Sistema basato su nodi: una faccia AI in cinque clip al giorno. Nessun modello, nessun fotografo, nessuno studio.Vitiligo come feature unica e non copiabile. Midjourney per la base, LoRA su Flux per bloccare il volto. Kling anima, ElevenLabs dà la voce, HeyGen sincronizza le labbra. TikTok alimenta il trend. Shopify vende merch sotto quella faccia.Ogni clip costa quaranta centesimi, il brand paga tremilaeduecento dollari, si spedisce in dodici minuti. Prima notte live: sessantaduemila view in diciotto ore. Trecentododici ordini, novemilatrecentosessanta dollari. Per una ragazza che era un prompt settantadue ore prima.Trovate i link di queste notizie altri link interessanti sul mio sto ziobuddalabs punto itSalvate il video così da non perderlo, seguitemi sui miei canali social e sul nuovo podcast su spotify e mannaggia a voi se ancora non lo state facendo, condividete il video con amici e nemici e ola todos.

Url delle notizie