Ola todos! ecco le notizie dedicate al mondo IA del 13 Maggio 2026Mira Murati ha lasciato OpenAI e dopo un anno di silenzio ha lanciato Thinking Machines. Il modello TML-Interaction-Small (duecentosettantasei miliardi di parametri, dodici attivi) non funziona più a turni. Ascolta, vede, parla, pensa e agisce CONTEMPORANEAMENTE. Zero virgola quattro secondi di latenza. Duecento millisecondi di micro-turni. Traduzione simultanea mentre entrambe le parti parlano. L’intera interazione è un flusso continuo. Mai visto niente del genere.E non è finita qui…Mobbin ha rilasciato un server MCP che collega seicentomila schermate di app reali a Claude e Cursor. Paywall, onboarding, checkout, permission flow. Tutto estratto da app già in produzione. Gli agenti IA scrivono codice da anni ma non hanno mai saputo cosa fosse davvero un buon design. Adesso lo sanno.Ma c’è qualcosa di ancora più interessante…TrustClaw è open source. Deploy in un comando su Vercel. Assistente personale ventiquattro sette con oltre mille integrazioni OAuth. Gmail, Calendar, Notion, Slack, GitHub, HubSpot, Linear. Tutto sandbox. Tutto protetto. Licenza MIT. Mille utenti nelle prime quarantotto ore. Ora il codice è pubblico e chiunque può clonarlo.Sempre in tema, ma con un salto di scala…Ponder ha raccolto due virgola cinque milioni in pre-seed per un editor video agentivo. Agenti creativi e umani collaborano per costruire storie. Frame.io, Box, Jared Leto tra gli investitori. L’editing diventa una conversazione.Passiamo a qualcosa di completamente diverso…Pixal3D (SIGGRAPH ventiseiesimo) genera modelli tridimensionali pixel-aligned. Non più generazione in spazio canonico con cross-attention. Pixal3D genera direttamente in camera space. La mesh è ALLINEATA all’immagine da subito. Back-projection esplicita delle feature. Fedeltà a livello di ricostruzione mantenendo la creatività della generazione. Codice, paper e demo Hugging Face già disponibili.E a proposito di numeri…Google ha rilasciato DESIGN.md. Sistema che permette agli agenti di capire regole di design, accessibilità e componenti da un singolo file Markdown. Compatibile con Claude Code, Cursor e altri. Open source. Gratis. Risolve uno dei maggiori problemi del design con IA.Perceptron ha annunciato Mk1: frontier video e embodied reasoning. Il modello sembra puntare a comprensione fisica avanzata e ragionamento incarnato in scenari video complessi.Supertonic ha rilasciato un modello text-to-speech on-device. Centosessantasette volte più veloce del real-time su M4 Pro. Sessantasei milioni di parametri. Milleduecentosessantatré caratteri al secondo. Gira su Raspberry Pi. Su e-reader in modalità aereo. Licenza MIT. Duemilasettecento stelle GitHub.xAI ha vinto il benchmark tau-Voice di Artificial Analysis con Grok Voice Think Fast uno punto zero. CINQUANTADUE VIRGOLA UNO percento di task completati in scenari customer service realistici. Cinque virgola sei minuti medi di conversazione. OpenAI e Gemini seguono sotto il quaranta percento.Jina AI ha rilasciato embeddings-v5-omni. Primo modello universale per testo, immagini, audio e video. Due versioni: small (uno virgola cinquantasette miliardi, milleventiquattro dimensioni, trentaduemila context) e nano (zero virgola novantacinque miliardi, settecentosessantotto dimensioni, ottomila context). Retrocompatibile con v5-text.Meta ha introdotto conversazioni vocali con Meta AI alimentate da Muse Spark. Interruzioni naturali, cambio argomento e lingua senza stop. Genera immagini mentre parli. Puoi puntare la fotocamera verso il mondo e fare domande su quello che vedi in tempo reale.Google ha anticipato Gemini Omni. Schermata apparsa nell’app Gemini prima di Google I/O (diciannove-venti maggio). Editing video direttamente in chat. Sembra voler sostituire Veo con un sistema integrato in Gemini. Alcuni utenti lo stanno già testando.Google ha anche annunciato Gemini Intelligence su Android. Automazione multi-step cross-app, navigazione e autofill proattivo. Rilascio PRE Google I/O. Segnale che all’evento arriverà qualcosa di molto più grande.Googlebooks: nuovi laptop Android progettati per Gemini da zero. Magic pointer suggerisce azioni puntando su date, oggetti o immagini. Crea widget custom tramite prompt. Gemini integrato nel sistema operativo. Disponibile quest’anno.Unsloth ha aperto il fine-tuning di Gemma 4 gratis nel browser. Notebook Colab, scegli modello e dataset, avvii. Barriera a zero.AntAngelMed: primo LLM medico open source da cento miliardi di parametri (solo sei virgola uno attivi). Top su MedBench e HealthBench. Duecento token al secondo su H20. Centotrentottomila token di contesto. Gira localmente con circa cinquanta GB in INT4. Privacy completa. Costruito da Zhejiang Health e Ant Healthcare.TradingAgents: framework multi-agente che replica la struttura di una vera trading firm. Analisti fondamentali, sentiment, tecnici, trader e risk manager. Ogni agente discute, vota, sfida gli altri. Sessantaduemilaseicento stelle GitHub. Licenza Apache due punto zero. Una hedge fund sul tuo laptop. Gratis.Mautic: alternativa open source a HubSpot e Marketo. Novemilacinquecento stelle GitHub. Attivo dal duemilaquattordici. Email marketing, landing page, lead scoring, CRM integrato. Multi-canale. Self-hosted. Nessun costo mensile.Il settore non si ferma mai.Trovate i link di queste notizie altri link interessanti sul mio sto ziobuddalabs punto itSalvate il video così da non perderlo, seguitemi sui miei canali social e sul nuovo podcast su spotify e mannaggia a voi se ancora non lo state facendo, condividete il video con amici e nemici e ola todos.