Agora-1: il primo world model dove puoi giocare in quattro. Contemporaneamente.

Odyssey ha appena rilasciato Agora-1, e no, non è l’ennesimo modello che genera mondi digitali da solo. Questa volta ci giocate in quattro. Insieme. Nello stesso identico mondo simulato, in tempo reale.

Fino a oggi i world model avevano un limite piuttosto evidente: funzionavano con un solo agente attivo. Tu, o un’IA, ma uno alla volta. Agora-1 rompe questo schema introducendo simulazioni multi-agente. E per farlo hanno scelto GoldenEye — sì, quello della Nintendo 64 che ha traumatizzato intere generazioni con lo schermo diviso in quattro.

Un deathmatch generato al volo, pixel per pixel

Quattro giocatori entrano in una partita. Tutto quello che vedono — ambienti, movimenti, interazioni, esplosioni — è generato da Agora-1 in tempo reale. Il modello simula le azioni dei giocatori, mantiene uno stato condiviso del mondo tra tutti i partecipanti, e invia i pixel generati a ciascuno simultaneamente. In pratica, Agora-1 funziona come un game engine appreso. Non c’è codice che dice ‘se premi X, spara’. C’è un modello che ha imparato come funziona GoldenEye guardando il gioco dall’interno.

Il risultato? Una simulazione condivisa dove ogni partecipante interagisce con lo stesso mondo generato. Non è una replica perfetta del gioco originale — è una versione completamente sintetica, ma coerente.

Come funziona: stato condiviso più rendering separato

La maggior parte dei world model precedenti concatenava gli stati degli agenti in una singola rappresentazione, tipo split-screen virtuale. Altri, come Solaris, concatenavano i partecipanti lungo la dimensione della sequenza in un transformer autoregressivo. Funziona, ma non scala bene: più giocatori = contesto più lungo = problemi di efficienza. E quando i giocatori perdono la linea visiva l’uno con l’altro, la consistenza crolla.

Agora-1 fa diversamente. Disaccoppia simulazione e rendering.

Prima parte: un modello impara come evolve lo stato del mondo in risposta alle azioni dei giocatori. Non genera pixel, genera lo stato interno del gioco — posizioni, salute, munizioni, tutto quello che normalmente gestirebbe un motore di gioco tradizionale. Questo modello è addestrato direttamente sullo stato interno di GoldenEye, quindi impara le dinamiche di gioco senza bisogno di regole hard-coded.

Seconda parte: un secondo modello, basato su DiT (Diffusion Transformer), prende quello stato condiviso e lo renderizza visivamente. Non è condizionato da prompt testuali o immagini, ma direttamente dallo stato del gioco. Il che significa che può generare viste coerenti dello stesso mondo da angolazioni diverse, simultaneamente.

Pensatela così: è come un game engine moderno, ma entrambe le componenti sono sistemi appresi. Niente logica cablata, tutto derivato dai dati.

Manipolare lo stato del gioco (sì, generare nuovi livelli)

Una conseguenza interessante di questa architettura: lo stato del mondo è manipolabile direttamente. Agora-1 può generare livelli completamente nuovi mantenendo le dinamiche di gioco coerenti con il titolo originale. Non è solo riproduzione — è generazione controllata di ambienti inediti che ‘si sentono’ come GoldenEye.

Il modello traccia posizione, salute, orientamento e altro per ogni agente. Lo stato è discreto, strutturalmente diverso dai domini visivi continui su cui operano la maggior parte dei DiT. Questo ha richiesto architetture specifiche e grandi quantità di dati strutturati di gameplay.

Oltre i giochi: reinforcement learning multi-agente

Odyssey vede Agora-1 anche come ambiente di ricerca per RL multi-agente. Il loro argomento: il progresso verso agenti più generali non è più limitato dall’architettura dei modelli, ma dalle esperienze disponibili durante il training. Nello specifico, dalla capacità di un agente di cercare attivamente interazioni che migliorano le proprie capacità.

I world model tradizionali supportano un solo partecipante interattivo. Questo limita i tipi di ambienti RL che possono gestire, incluso il loro recente lavoro su PROWL — un framework avversariale dove policy RL esplorano il mondo simulato cercando di rompere il modello e generare nuovi dati di training dai fallimenti.

Con più agenti, lo spazio di interazione congiunto cresce in modo combinatorio. Le dimostrazioni raccolte passivamente coprono una frazione sempre più piccola delle interazioni significative: collisioni, movimenti coordinati, obiettivi contesi, comportamenti emergenti. Il reinforcement learning multi-agente offre un meccanismo scalabile per generare questi dati mancanti attraverso interazione aperta. Agenti e world model possono co-evolvere, spingendosi a vicenda in regimi sempre più complessi.

Training immaginato: allenarsi dentro mondi generati

Agora-1 può anche funzionare come simulatore generativo multi-agente autonomo. Policy addestrate interamente dentro questi mondi generati potrebbero generalizzare ad ambienti mai visti e partner di interazione sconosciuti — senza mai accedere al gioco originale. Agenti competitivi, cooperativi, popolazioni miste che imparano completamente dentro ambienti sintetici.

Odyssey crede che questo tipo di training immaginato possa diventare un mattone fondamentale per allenare forme più avanzate di intelligenza dentro mondi simulati aperti.

Non solo GoldenEye

L’architettura dietro Agora-1 non è limitata ai videogiochi. Molti sistemi reali richiedono agenti multipli che operano nello stesso ambiente condiviso. Robotica collaborativa, per esempio: robot che devono ragionare insieme su azioni, spazio, interazioni reciproche.

Più in generale, i world model multi-agente potrebbero abilitare nuove forme di sistemi interattivi difficili da realizzare con simulatori tradizionali o motori di gioco convenzionali. Odyssey è curiosa di vedere cosa costruiranno ricercatori e sviluppatori con questi modelli.

Stato attuale: semplice, ma non per sempre

Il modello di stato di Agora-1 oggi è relativamente semplice. Ma non è un limite fondamentale. In linea di principio, la rappresentazione interna dello stato può scalare arbitrariamente, abilitando simulazioni e dinamiche di gioco sempre più complesse. Nel tempo, Odyssey si aspetta che questi sistemi generalizzino attraverso regole e rappresentazioni di stato diverse, permettendo di generare esperienze completamente nuove direttamente dall’interazione dell’utente con il modello.

Il loro obiettivo di ricerca più ampio: capire come l’interazione multi-agente può estendersi a foundation world model senza compromettere il comportamento aperto o la generalità. Credono sia possibile attraverso sistemi appresi, non meccanismi di coordinamento espliciti scritti a mano. Ambienti di ricerca come Agora-1 offrono un setting controllato per studiare questi problemi.

Agora-1 è una preview di ricerca. Un esperimento. Ma punta verso un futuro dove i world model supportano interazione condivisa, gameplay emergente, robotica collaborativa, e agenti che imparano insieme dentro mondi simulati. Combinato con sistemi come PROWL — che permette ai world model di migliorare attraverso esplorazione attiva — Odyssey pensa che questi approcci potrebbero eventualmente formare le fondamenta per addestrare forme più avanzate di intelligenza dentro mondi simulati aperti.

Il modello è disponibile per essere provato. Quattro giocatori, un mondo generato, zero righe di codice di gioco tradizionale. Benvenuti nel deathmatch sintetico.