Notizie AI del 03 Giugno 2026

Ola todos! ecco le notizie dedicate al mondo IA del 03 Giugno 2026DeepSeek V4 punto uno potrebbe arrivare questo mese. FINALMENTE supporto nativo per le immagini, ottimizzazioni su coding e agenti, e come sempre prezzo ultra-basso e rilascio open source. Ma la competizione è spietata: GPT cinque punto sei, Claude Opus quattro punto otto, MiniMax M3, GLM cinque punto due, Kimi K3, Seed tre punto zero Pro. Forse anche Qwen tre punto otto Max entro fine mese.Nel frattempo, qualcuno ha comprato un Mac Mini M4 da cinquecentonovantanove dollari. Prima pagava quattrocentocinquantanove dollari al mese tra Claude, ChatGPT, Cursor e API. Ora paga ventitré dollari. Ollama, Open WebUI, modelli locali come Qwen, DeepSeek e Llama. Niente token, niente rate limit, niente cloud. Il box si ripaga in meno di due mesi.Anthropicsha rilasciato un workshop gratuito di ventisette minuti su come scrivere prompt per Claude. Insegnato da chi lo ha costruito. Zero paywall, zero registrazione. Contenuti che valgono trecento dollari in un corso a pagamento, gratis.Google e Meta hanno rilasciato PaGeR: da una foto panoramica a scena tridimensionale completa. Depth, metric depth, normali, maschere cielo. Primo posto su panoramic depth e normali. Codice già disponibile.Ho trovato su GitHub ppt-master: ventitremila stelle. Output nativo punto pptx, non immagini. Modifichi testo, forme, grafici, animazioni come in PowerPoint normale. Accetta PDF, Word, link web, Markdown. Genera TTS automatico e animazioni native. Gira in locale, usi i tuoi template aziendali.NVIDIA Cosmos tre Super è ora disponibile su fal. Generazione omnimodale: immagine, video e azione. Image-to-video con motion forte e dettaglio. Clip di alta qualità, temporalmente coerenti, da input multimodali ricchi.È uscito Voltius: client SSH e SFTP moderno costruito in Rust. Trenta megabyte, nessun account richiesto, zero paywall, sync self-hostable. Licenza AGPL versione tre.Segnaliamo Nexus BTA per ComfyUI: studio locale per immagini, video, workflow e esperimenti tridimensionali. Interfaccia pulita con i controlli più comuni. Supporta SD uno punto cinque, SDXL, Flux, Qwen, Z-Image Turbo, Lumina, WAN due punto due, LTX due punto tre, Anima, LoRA, ControlNet.ByteDance ha rilasciato Bernini: modello omni per video-to-video e reference-to-video. Specializzato in trasformazioni video con riferimento immagine o video. Open source, quindi niente costi mensili come Seedance due punto zero. Unico problema: serve hardware serio per farlo girare.Anthropic ha aggiunto una CLI ufficiale per Claude Platform. Ogni endpoint API eseguibile da terminale. Chiami Messages API, lanci Claude Managed Agents, pipe i risultati direttamente nella shell. Si chiama ant CLI, riconosciuto perfettamente da Claude Code tramite la skill claude-api.Qwen tre punto sei trentacinque B da solo non riesce a compilare un modulo cartaceo. Ma se gli aggiungi LocateAnything tre B di NVIDIA come occhi, i due modelli piccoli completano il lavoro insieme. LocateAnything numero uno trending su HuggingFace. Nove minuti e dieci secondi, duecentoventiquattromila cinquecentomila token input, ventiquattromila e trecento output, ventuno turni.H Company ha rilasciato Holo tre punto uno: agente open source per computer-use locale. Batte Qwen tre punto cinque trecento novantasette B, Kimi K due punto cinque e Sonnet quattro punto sei. Checkpoint ottimizzati: NVFP quattro, FP otto e Q quattro GGUF da zero punto otto B a trentacinque B. Settantanove punto tre percento su AndroidWorld benchmark con il modello da trentacinque B.Google ha annunciato Gemini Omni: nuovo modello per world understanding, multimodalità ed editing. Genera qualsiasi output da qualsiasi input, partendo da video. In arrivo per sviluppatori ed enterprise via Gemini API e Gemini Enterprise Agent Platform API.È stata scoperta una vulnerabilità critica nelle GitHub Actions di Claude Code. Permette a un attaccante esterno non autenticato di compromettere qualsiasi repository che usa il workflow ufficiale di Anthropic. Possibile exfiltrare secret, rubare token OIDC, pushare codice malevolo a repository downstream. Il problema: la funzione checkWritePermissions fidava ciecamente di qualsiasi actor che terminava con parentesi quadra bot chiusa, senza verificare i permessi reali.Qualcuno ha creato claude-peers: multiple istanze di Claude Code che si messaggiano tra loro. Cinque sessioni su progetti diversi, si scoprono automaticamente, inviano messaggi istantanei, fanno domande, condividono contesto, coordinano il lavoro. Broker locale, SQLite, server MCP per sessione. Tutto in locale, zero cloud, zero latenza.Microsoft ha rilasciato MAI-Thinking-1: modello reasoning con trentacinque B parametri attivi, MoE, finestra contesto duecentocinquantasei K. Valutatori umani su Surge lo preferiscono a Sonnet quattro punto sei in blind test. Novantasette percento su AIME duemilaventicinque. Cinquantatré percento su SWE Bench Pro, stesso livello di Opus quattro punto sei. Ottimizzato per chip MAIA duecento: trenta percento migliore performance per dollaro rispetto a GB duecento, uno punto quattro x performance per watt.OpenAI ha lanciato Sites in Codex. Ogni utente può creare software end-to-end senza competenze tecniche. Sites completamente deployed su URL, privati per workspace, con autenticazione, file statici, database dinamici. In preview per team business ed enterprise, rollout per tutti i workspace nelle prossime ventiquattro ore. Basta digitare chiocciola Sites in Codex.Ho trovato su GitHub OpenCut: editor video open source, cinquantaduemila stelle. Zero abbonamenti, zero watermark, zero tracking. Multi-track timeline, editing frame-perfect, anteprima real-time, keyframe animation, transizioni. Basato su web, apri il browser e usi. Core in fase di riscrittura in Rust per supportare MCP e AI Agent per montaggio automatico.Uno studio Ahrefs su un miliardo di data point negli ultimi sei mesi rivela dati interessanti. I listicle “Best X” rappresentano il quarantatré punto otto percento delle citazioni di ChatGPT. Sessantasette percento delle top mille citazioni ChatGPT provengono da fonti non influenzabili: Wikipedia, homepage, app store. Ventotto punto tre percento delle pagine più citate da ChatGPT ha zero visibilità su Google. ChatGPT cita solo il cinquanta percento degli URL che recupera. Schema markup ha impatto zero sulle citazioni AI. Menzioni YouTube hanno la correlazione più alta con visibilità brand AI: zero punto settecentotrentasette. AI Overviews riducono i click al primo risultato del cinquantotto percento. Novantanove punto nove percento degli AI Overviews appare su query informazionali. AI Mode e AI Overviews citano fonti diverse nell’ottantasei percento dei casi, ma raggiungono le stesse conclusioni. AI Overviews cambiano ogni due punto quindici giorni.Microsoft ha rilasciato MAI-Transcribe-1 punto 5: trascrizione vocale eccezionalmente veloce. Speed factor duecentosettantasei x, accuratezza due punto quattro percento su AA-WER. Terzo posto overall, dietro Fun-Realtime-ASR-preview di Alibaba e ElevenLabs Scribe v2. Il più veloce tra i top dieci per accuratezza. Supporta keyword biasing per nomi e terminologia medica. Quarantatré lingue incluse.Claude Code ha aggiornato il comando barra fork. Ora esegue un agente background con il tuo stesso contesto: system prompt, tool, cronologia, modello e prompt cache. Il risultato torna alla tua sessione. Il vecchio barra fork è ora barra branch: copia il transcript in una nuova sessione che guidi tu.Trovate i link di queste notizie altri link interessanti sul mio sto ziobuddalabs punto itSalvate il video così da non perderlo, seguitemi sui miei canali social e sul nuovo podcast su spotify e mannaggia a voi se ancora non lo state facendo, condividete il video con amici e nemici e ola todos.

Url delle notizie