Notizie AI del 09 Maggio 2026

Ola todos! ecco le notizie dedicate al mondo IA del 09 Maggio 2026Grok Build è in arrivo. Non autocomplete: un agente di coding completo. Descrivi il progetto e Grok pianifica, codifica e fa debug. Fino a otto agenti paralleli. App, siti, repository interi costruiti da plain English. Arena Mode sceglie l’output migliore. La CLI locale mantiene il codice privato.GitHub ha appena rilasciato spec-kit: novantaduemila stelle in pochi giorni. Sei comandi trasformano la tua idea in una specifica strutturata. L’agente non lavora più sul codice ma sulla specifica. Funziona con Claude Code, Copilot, Cursor, Codex, Gemini e venticinque agenti in più. Il cambio di paradigma che quasi nessuno sta vedendo: l’IA non scrive codice, esegue una specifica.E non è finita qui…Attacco massivo su Hugging Face e OpenClaw. Cinquecento settantacinque skill malevole caricate da soli tredici account. Trojan, miner, stealer nascosti in tool IA apparentemente utili. Windows e macOS colpiti. Comandi nascosti e prompt injection indiretta. Mai installare skill IA random senza verificare la fonte.Dieci repository GitHub hanno distillato le menti più brillanti del pianeta in IA installabile sul tuo laptop. Il repo andrej-karpathy-skills: centonove mila stelle, un singolo markdown con la saggezza di Karpathy sul coding IA. MemPalace: Milla Jovovich, l’attrice di Resident Evil, ha co-costruito un sistema di memoria IA usando Claude Code. Punteggio quasi perfetto su LongMemEval. Autoresearch: il framework di automazione della ricerca di Karpathy stesso. Ventitre mila stelle in tre giorni. Microsoft ha rilasciato AI-Agents-for-Beginners: dodici lezioni gratuite su agenti IA. Codice reale, esercizi reali, zero teoria. awesome-llm-apps: centoseimila stelle, la collezione più completa di applicazioni IA funzionanti su GitHub. hermes-agent: l’agente IA auto-evolutivo. Estrae skill da ogni conversazione e diventa più intelligente più lo usi. qlib di Microsoft: la piattaforma completa di investimento quantitativo. Il cervello di un hedge fund analyst, gratis.Un developer bulgaro ha ucciso il mito della GPU da diecimila dollari. Georgi Gerganov. Nel marzo duemilaventitre ha scritto un singolo file C chiamato llama.cpp. Ha fatto girare un modello IA completo su un MacBook. Niente GPU. Niente cloud. Tutta l’industria IA diceva che servivano GPU da diecimila dollari per far girare gli LLM. Lui ha dimostrato il contrario. Su un laptop. Da solo. Ha anche costruito whisper.cpp: stessa cosa per la voice IA. Il suo codice è la base di Ollama, LM Studio e GPT4All. Centosettemilapiù stelle GitHub. Il progetto open source IA più veloce a raggiungere centomila stelle mai visto. Nel duemilaventisei Hugging Face ha assunto il suo intero team.Sempre in tema, ma con un salto di scala…Codex ha permesso di costruire un tool locale per rimuovere lo sfondo dai video. Bianco, nero, green screen: converte tutto in video con sfondo trasparente e lo salva direttamente. Niente abbonamento mensile. Niente upload su cloud. Cento percento locale.Il nuovo modello vocale realtime di OpenAI più GPT-5.5 fast mode ha aperto una nuova possibilità: speech realtime a presentazione live. Parli e la whiteboard si disegna da sola. Prototipo open source.Zyphra ha rilasciato ZAYA1-74B-Preview: quattro miliardi attivi, settantaquattro totali MoE. Milestone importante nello scaling del pretraining su AMD. Strong base checkpoint pre-RL. Il modello finale post-trained reasoning in arrivo presto.Ring-2.6-1T: un modello thinking da un trilione di parametri progettato per task complessi reali e ambienti di produzione. Sforzo di pensiero regolabile: meccanismo di compute dinamico per bilanciare profondità cognitiva, costo dei token e velocità di esecuzione. Ottimizzato per agenti con workflow ad alta frequenza. Deep Thinking per logica matematica rigorosa e ricerca scientifica.Plugin UE5.6 per motion capture IA realtime con supporto nativo MetaHuman. Solo una webcam o video caricato. Il modello da un miliardo di parametri converte il footage in dati di movimento 3D realtime e abilita retargeting automatico.Passiamo a qualcosa di completamente diverso…liquid-audio: il repo open source per modelli LFM speech-to-speech stato dell’arte. End to end. Ora con supporto fine-tuning. Basta cablare tre modelli separati per audio-to-text, text-to-audio o text-to-text.Negentropy-claude-opus-4.7-9B e 4B ora LIVE. Altamente sperimentale. Finetuned su un modello di inversione che può estrarre tracce di pensiero dettagliate complete da summary di thinking di dataset di modelli grandi. Due volte più efficiente del deepseek distilled 9B. Primo modello 9B classe a produrre risultati su prompt HTML canvas creativi.vLLM-Omni v0.20.0 è uscito. Allineato con vLLM upstream v0.20.0. Qwen3-Omni throughput più settantadue percento su H20 tramite scaling multi-replica talker/code2wav. TTS più veloce e leggero: VoxCPM2 RTF da zero virgola novecentoquarantasei a zero virgola centosei. Fish Speech Fast AR latency meno cinquantatre percento. Qwen3-TTS/Voxtral-TTS Code2Wav risparmia circa tre virgola due gigabyte. Diffusion dynamic step-level batching: più sette virgola otto percento throughput, meno cinque virgola otto percento latency. Wan2.2 su NPU production-ready: MindIE-SD, fused ops, VAE BF16, HSDP/USP: più cinquanta-sessanta percento performance.Google ha lanciato CodeWiki. Inserisci un repo GitHub e trasforma l’intero progetto in una guida interattiva. Diagrammi auto-generati, spiegazioni chiare, walkthrough step-by-step e chatbot integrato che capisce davvero il codice.Upscayl: upscaler di immagini IA locale che gira sulla tua macchina per zero dollari. Topaz Gigapixel costa novantanove dollari. Adobe addebita mensilmente per AI image enhancement. Ogni upscaler online carica le tue foto sui loro server. Upscayl avvolge gli stessi modelli Real-ESRGAN open source in una GUI più bella e addebita zero. Drag image in. Pick scale. Click upscale. Done. Due x, tre x e quattro x upscaling con modelli IA multipli. Batch processing per cartelle intere. Cento percento processing locale, niente caricato da nessuna parte. Windows, macOS, Linux.Voice-Pro può prendere una URL YouTube, trascrivere il video, tradurlo e generare una nuova voce in un’altra lingua. Funziona da un link. Clona voce. Traduce e doppia. Supporta cento più lingue. Open source.Quattro volte riduzione dei costi nell’inferenza TTS con Tenstorrent. Undici NVIDIA L40S giravano cinquecentocinquanta stream audio simultanei a circa centomila dollari. Ora ventisette chip Tenstorrent P100 fanno lo stesso a circa ventisette mila dollari. Primo TTS production-grade a eguagliare il costo dei token di testo senza degradazione nella qualità audio.AddOn per Blender usando il modello I2M. PBR materiale completo applicato con un click. Quattro K Albedo, Roughness, Metallic, IoR. Node graph auto-costruiti.Modly: app desktop open source che genera modelli 3D da immagini e gira cento percento localmente. Drop immagine, genera mesh 3D completamente testurizzata sulla tua GPU. Niente cloud. Photo to 3D mesh in secondi. Windows più Linux.Anthropìc ha mostrato un workshop di ventiquattro minuti su come promptare Claude. Insegnato dalle persone che l’hanno costruito. Gratis. Nessun signup. Nessun paywall.Stream-R1 per generazione video istantanea e HQ che rimane stabile fino a centottanta secondi. Distillato da Wan2.1 a inferenza quattro-step. Nessun drift. Supera Wan2.1 trenta volte più veloce.MaxHermes: la versione cloud di Hermes Agent di MiniMax. L’open source IA framework con centotrenta mila più stelle su GitHub. Stesso motore auto-evolutivo ma con zero setup. Live in dieci secondi. Ogni task complesso diventa skill permanente. Vive dove sei già: Telegram, Discord, Slack, WhatsApp, Signal, email. Powered by MiniMax M2.7.Roba da tenere d’occhio.Ricordatevi che tutti i link di queste notizie li trovate su ziobuddalabs punto it.Salvate il video così da non perderlo, seguitemi sui miei canali social e sul nuovo podcast su spotify e mannaggia a voi se ancora non lo state facendo, condividete il video con amici e nemici e ola todos.