HALLUHARD: il benchmark che svela quanto i modelli AI mentono nelle conversazioni

Vi siete mai chiesti quante volte ChatGPT o Claude vi hanno raccontato frottole senza che ve ne accorgeste? Probabilmente più di quanto immaginiate. Un gruppo di ricercatori dell’EPFL e dell’ELLIS Institute ha deciso di andare a fondo e i risultati – diciamocelo – fanno riflettere parecchio. Perché serviva un nuovo test per le allucinazioni Il […]
ChatGPT introduce la pubblicità: cosa cambia per gli utenti dell’intelligenza artificiale

OpenAI apre le porte agli annunci pubblicitari Ok, è successo. Quella cosa che molti temevano e altri davano per scontata: ChatGPT ha iniziato a mostrare pubblicità. OpenAI ha annunciato lunedì l’avvio dei test negli Stati Uniti per gli utenti dei piani Free e Go. Se usate il chatbot più famoso del pianeta senza pagare, preparatevi […]
Agent teams: sedici Claude che scrivono un compilatore C mentre dormi

Sedici istanze di Claude Opus 4.6 che lavorano in parallelo, di notte, senza supervisione umana. Il risultato? Un compilatore C scritto in Rust, 100.000 righe di codice, capace di compilare il kernel Linux. E sì, fa girare Doom. Nicholas Carlini, ricercatore del team Safeguards di Anthropic, ha pubblicato questo esperimento il 5 febbraio 2026. Non […]
OpenAI Frontier: la piattaforma che trasforma gli agenti AI in colleghi enterprise

Partiamo da un dato che fa riflettere: il 75% dei lavoratori enterprise dice che l’AI li ha aiutati a completare task che prima erano semplicemente impossibili. Non stiamo parlando di automazioni banali o chatbot che rispondono alle FAQ. Parliamo di lavoro vero, quello che prima richiedeva settimane di tempo umano. OpenAI ha annunciato Frontier il […]
Claude Opus 4.6: Anthropic alza l’asticella con agent teams e context window da 1 milione di token

Il nuovo modello che sta facendo tremare il mercato del software Il 5 febbraio 2026, mentre Wall Street ancora digeriva un crollo da 285 miliardi di dollari nel settore software, Anthropic ha rilasciato Claude Opus 4.6. Tre giorni prima OpenAI aveva lanciato la sua app desktop Codex. Coincidenza? Difficile crederci. La guerra per l’intelligenza artificiale […]
OpenAI Codex App per macOS: il centro di comando per agenti AI che cambia lo sviluppo software

Un nuovo modo di costruire software con l’intelligenza artificiale Ok, fermiamoci un secondo. Se lavorate nel mondo dello sviluppo e avete seguito l’evoluzione degli strumenti AI negli ultimi due anni, sapete che ogni settimana qualcuno annuncia “la rivoluzione”. Ma questa volta – e sì, capisco lo scetticismo – parliamo di qualcosa che cambia davvero le […]
OpenClaw: quando l’assistente AI diventa la porta sul retro della tua azienda

Un agente AI autonomo che ha conquistato internet nasconde vulnerabilità critiche Nelle ultime settimane OpenClaw ha dominato i social media, GitHub e i forum tecnici. Un assistente AI always-on che vive nelle piattaforme di chat, esegue compiti per conto degli utenti e opera continuamente con supervisione minima. Per molti rappresenta il futuro dell’automazione personale e […]
Febbraio 2026: SpaceX e xAI si fondono, medici AI gratuiti e agenti che assumono umani

C’è qualcosa di strano nell’aria di questo febbraio 2026. Non parlo del meteo – parlo di quello che sta succedendo nel mondo dell’intelligenza artificiale. E credetemi, le notizie di oggi meritano attenzione. La fusione che nessuno si aspettava: SpaceX incontra xAI Elon Musk ha fatto di nuovo una delle sue. Dopo un video criptico pubblicato […]
Corsa ai modelli AI cinesi prima del Capodanno lunare: cosa significa per il settore

Il Capodanno lunare diventa la vetrina dell’intelligenza artificiale cinese C’è qualcosa che sta succedendo nel panorama dell’intelligenza artificiale cinese e vale la pena parlarne. I principali laboratori AI del paese stanno trasformando le settimane che precedono il Capodanno lunare in una vera e propria maratona di rilasci. Non è un caso: quando un miliardo e […]
ChatGPT vs Grok vs Gemini vs Claude vs Perplexity: guida pratica alle AI del 2026

Il panorama AI è cambiato. E con lui, il modo in cui lavoriamo Okay, diciamocelo chiaramente: se nel 2024 la domanda era “quale AI è migliore?”, nel 2026 questa domanda non ha più senso. È come chiedere se sia meglio un martello o un cacciavite. Dipende da cosa devi costruire. Ho passato le ultime settimane […]
