Notizie AI del 16 Maggio 2026

Ola todos! ecco le notizie dedicate al mondo IA del 16 Maggio 2026Anthropic ha modificato la politica di billing per le subscription Claude. Dal quindici giugno SDK Agent e uso via claude-p escono dai limiti subscription e passano a un pool crediti separato. Tariffato a prezzo API pieno. Prima tutto attingeva dallo stesso pool sovvenzionato: duecento dollari di piano Max potevano bruciare mille dollari di token. Ora i crediti nuovi sono venti dollari per Pro, cento per Max cinque-x, duecento per Max venti-x. A tariffe API piene durano pochi giorni. Terza modifica in sei settimane. Se usi solo Claude Code interattivo non cambia nulla. Se hai pipeline CI, GitHub Actions o agenti schedulati: aumento di prezzo enorme.E non è finita qui…È uscito SANA-WM: world model open source da due punto sei miliardi di parametri. Una singola immagine più testo più traiettoria camera sei-DoF generano sessanta secondi di video a settecentoventi-p. Action-controllable. Una GPU. Minuti di mondo sintetico.Ma c’è qualcosa di ancora più interessante…ComfyUI ha integrato nativamente tre nuovi modelli open source. Gemma quattro di Google DeepMind: LLM multimodale con testo, immagine, audio e video input più reasoning step-by-step integrato. VOID di Netflix: rimozione oggetti video che cancella anche ombre, riflessi e interazioni fisiche causate dal soggetto rimosso. BiRefNet: segmentazione background e oggetti ad alta risoluzione, uno dei modelli più usati nell’ecosistema.Sempre in tema, ma con un salto di scala…Higgsfield ha lanciato Supercomputer: agente cloud-native che unifica ogni modello, tool e workflow creativo in un solo sistema. Prompt unico. Specifichi lunghezza e tipo. Supercomputer sceglie workflow, distribuisce swarm di agenti, instrada ogni sub-task su LLM frontier giusto — Opus quattro punto sette, GPT cinque punto cinque Pro, Gemini tre punto uno Pro — e modello video giusto — Seedance, Veo, Kling. Cartoon o film finito. Da un prompt a sessanta minuti di output. Studio cinematografico in un agente.Passiamo a qualcosa di completamente diverso…Mercury due genera token in parallelo. Oltre mille token al secondo su GPU standard. Qualità comparabile a modelli speed-optimized. Diffusion LLM. Gli attuali modelli autoregressivi generano un token alla volta. Questo cambia tutto.E a proposito di velocità…Hermes Agent e OpenClaw testati con Qwen trentacinque-B local. MacBook Pro M cinque Max sessantaquattro Gb. Task: scraping GitHub star history, analisi spike di crescita, dashboard live in browser. OpenClaw: duecentotremila token, dodici minuti uno secondo. Hermes: duecentocinquantasettemila token, trentatré minuti uno secondo. Entrambi hanno consegnato dashboard live con grafici e annotazioni spike. OpenClaw ha scritto bash script. Hermes ha fatto parallel tool calls su GitHub API, web search e browser.Gemini tre punto uno più sparkjs ora può annotare semanticamente gaussian splat tridimensionali al volo. Carichi scena tridimensionale, premi scan, ottieni detection bidimensionali da VLM, clustering output proiettati in spazio world tridimensionale, salvi come layer semantico persistente. Salto da bidimensionale a tridimensionale.Supertone ha rilasciato supertonic-tre: TTS da novantanove milioni di parametri. Gira su CPU. Più veloce di un LLM da due miliardi su A cento. ONNX Runtime. Completamente locale. Browser, smartphone, Raspberry Pi. Open source.E sempre parlando di hardware…NVIDIA ha lanciato un computer da duecentoquarantanove dollari. Sessantasette TOPS. Gira Llama tre punto uno-otto-B in locale. Zero internet. Zero API. Zero fee mensili. Più piccolo di un router. Stesso prezzo degli AirPods. Stessi modelli per cui paghi duecentoquaranta dollari l’anno su ChatGPT. IA locale a prezzo accessibile.Gemini tre punto due Flash potrebbe arrivare vicino a performance GPT cinque punto cinque su coding e reasoning. Costi inferenza più bassi. Latenza sotto i duecento millisecondi per la maggior parte delle query. Google sta usando distillation e sparsity per comprimere capability di modelli grandi in versione lightweight. Possibile rename a Gemini tre punto cinque Flash. Pricing leak: zero punto venticinque dollari input, due dollari output per milione di token. Knowledge cutoff gennaio duemilaventisei. Previsto intorno a Google I/O.Anthropic ha rilasciato trentuno small business skills per Claude. Installabili in Cowork in tre step. Plugin unico, dodici connettori supportati al lancio, onboarding automatico. Coprono money, sales, CRM, marketing, customer support, briefing, setup, hiring e legal. Da preparazione tasse trimestrali a gestione payroll, chase fatture, triage lead, cleanup CRM, content strategy, customer pulse, contract review. Trentuno workflow completi.Anthropic ha pubblicato un workshop di ventiquattro minuti su come scrivere prompt per Claude. Insegnato da chi ha costruito il modello. Gratuito. Nessuna registrazione. Copre più dei corsi da trecento dollari. Da guardare e salvare subito.NVIDIA sta offrendo accesso API gratuito a oltre ottanta modelli IA hosted. MiniMax M due punto sette, GLM cinque punto uno, Kimi due punto cinque, DeepSeek tre punto due, GPT-OSS-centoventiventi-B, Sarvam-M e molti altri. Funziona direttamente con Cursor, Zed, OpenCode, Hermes, OpenClaude. API Key gratis. Inferenza gratis per prototyping ed esperimenti.Tencent ha rilasciato Free Local Pixal3D: ogni pixel proiettato direttamente in spazio tridimensionale. Ricostruzione sub-pixel fedele. Zero allucinazioni. Corrispondenza silhouette perfetta. Open weights. Locale su ventiquattro Gb VRAM. Nuovo benchmark per tridimensionale open source.Ed infine Stanford ha pubblicato una lezione di due ore su come funzionano internamente LLM come ChatGPT e Claude. Più di quanto la maggior parte delle persone che lavorano in top AI companies impari in carriera. Gratuita.Giornata ricca anche oggi.Trovate i link di queste notizie altri link interessanti sul mio sto ziobuddalabs punto itSalvate il video così da non perderlo, seguitemi sui miei canali social e sul nuovo podcast su spotify e mannaggia a voi se ancora non lo state facendo, condividete il video con amici e nemici e ola todos.