Sakana AI ha appena rilasciato Fugu Ultra, e no, non è l’ennesimo LLM gigante addestrato su miliardi di parametri. È qualcosa di diverso: un sistema che coordina dinamicamente i migliori modelli del mondo per risolvere task complessi. Dall’esterno sembra un singolo modello. Dentro? Un’orchestra di esperti che lavorano insieme.
E la tempistica non è casuale.
Perché proprio ora: la dipendenza da un singolo vendor è diventata un problema reale
Sakana lo dice chiaro: le recenti restrizioni all’export imposte sui modelli Fable 5 e Mythos Preview di Anthropic hanno dimostrato che affidarsi a un solo fornitore — per infrastrutture critiche, finanza, governance — è una vulnerabilità materiale. Non più teoria: realtà. Le policy cambiano, i confini regolatori si spostano, e l’accesso può sparire da un giorno all’altro.
Fugu risponde a questo con un approccio pragmatico: orchestra modelli che puoi sostituire. Se un provider chiude i rubinetti, il sistema passa a un altro. Resilienza pratica, non slogan.
Cosa è davvero Sakana Fugu
Fugu è un modello di linguaggio addestrato a chiamare altri LLM da un pool di agenti — incluso se stesso, ricorsivamente. Tu mandi una richiesta a un singolo endpoint. Fugu decide: risolvo da solo, oppure assemblo una squadra di modelli specializzati?
La gestione è interna: selezione del modello, delega, verifica, sintesi finale. La complessità del multi-agente non arriva mai al tuo codice. API singola, compatibile OpenAI.
Questo approccio si basa su due paper accettati a ICLR 2026: Trinity e Conductor. Non è orchestrazione hard-coded con regole fisse — Fugu ha imparato quando delegare, come far comunicare gli agenti, come unire i risultati in una risposta affidabile.
Due versioni, due use case
Fugu bilancia performance e latenza bassa. Perfetto per coding, code review, chatbot, servizi interattivi. Puoi anche escludere agenti specifici dal pool per motivi di compliance o privacy.
Fugu Ultra punta alla massima qualità su problemi multi-step difficili. Usa un pool più profondo di esperti quando conta la precisione. Gli utenti beta l’hanno usato per ricerca AI, riproduzione di paper, analisi di cybersecurity, indagini su letteratura e brevetti.
I numeri: Fugu Ultra tiene il passo con i frontier model
Sui benchmark standard — coding, reasoning, scienze, capacità agentiche — Fugu Ultra si piazza allo stesso livello di Fable 5 e Mythos Preview. Con una differenza: nessun rischio di export control.
Sakana riporta i punteggi confrontandoli con i modelli sottostanti che Fugu usa internamente, tipo Gemini 3.1 Pro, Opus 4.8, GPT 5.5. In task come AutoResearch, design meccanico, analisi di scrittura giapponese a mano, previsioni finanziarie su serie temporali, Fugu batte costantemente i singoli frontier model.
Certo, i benchmark raccontano solo metà della storia.
Cosa dicono gli utenti veri (500 beta tester)
Sakana ha fatto girare Fugu in beta con quasi 500 utenti, concentrandosi su workflow lunghi, sporchi, realistici. Quelli dove un singolo prompt non basta.
Un ingegnere software: ‘Per il code review, Fugu Ultra è significativamente meglio di GPT-5.5. Risposte complete, trova bug che altri modelli ignorano. Dove altri tool segnalano tre problemi, Fugu ne ha tirati fuori più di venti.’
Un executive di una piattaforma enterprise: ‘La qualità grezza dell’output è pari ai top frontier model, ma Fugu ha mostrato una stabilità di persona insolitamente forte in sessioni lunghe — mantiene la sua identità dove altri modelli derivano. Per prodotti agentici, questo può contare più dei punteggi nei benchmark.’
Un ingegnere di cybersecurity: ‘Data un’istruzione circoscritta, Fugu ha condotto un assessment di sicurezza end-to-end completo — ricognizione, controlli XSS/SQLi, review dell’autenticazione, report pulito con evidenze e passi di retest — rimanendo dentro lo scope ed evitando azioni distruttive.’
Il pattern è chiaro: Fugu brilla quando il task è lungo, confuso, articolato su molti step. Leggere, implementare, testare, confrontare prove, trovare gap, produrre un’analisi finale utile. Non solo una risposta migliore a un prompt — progresso sostenuto nel tempo.
Ricerca automatizzata quasi senza intervento umano
Durante il beta, alcuni utenti hanno fatto girare Fugu in modalità di ricerca quasi completamente automatizzata per data science. Il sistema esplorava idee, eseguiva esperimenti, interpretava fallimenti, rivedeva l’approccio, continuava a fare progressi. Con poca o nessuna supervisione umana.
Questo è esattamente il tipo di compito per cui Fugu Ultra è stato progettato: lavoro aperto, multi-step, dove serve continuare a muoversi nel tempo.
Perché ‘orchestrazione’ è il prossimo frontier
Negli ultimi anni il progresso AI è stato guidato da forza bruta: modelli giganti, monolitici, addestrati su montagne di dati. Ma i task reali difficili richiedono conoscenze e competenze specializzate multiple, ben oltre qualsiasi singolo benchmark.
Sakana sostiene una tesi precisa: i sistemi AI più potenti non saranno monoliti isolati, ma ecosistemi collaborativi. L’evoluzione biologica innova sotto vincoli — e il futuro appartiene a sistemi che imparano esplicitamente a coordinare l’intelligenza collettiva.
Oggi, questa orchestrazione non è più solo un’ottimizzazione tecnica. È diventata un imperativo geopolitico e operativo. La concentrazione di potere in pochi vendor è un rischio. L’intelligenza collettiva è la copertura pratica contro questa concentrazione.
Cosa succede ora
Fugu è disponibile da oggi in general availability. Entrambe le versioni tramite API singola, con piani subscription per uso quotidiano e pay-as-you-go per carichi enterprise pesanti.
Sakana ha già in programma di espandere il pool di agenti esperti — inclusi modelli open e i propri modelli proprietari — rafforzare la coordinazione per task long-running e agentici, e dare agli utenti più controllo su come Fugu opera per loro conto.
Perché Fugu non è costruito su workflow fissi. È orchestrazione appresa. Quando l’ecosistema migliora, Fugu migliora. Nuovi frontier model arrivano? Li pieghi nel pool di agenti e passi i guadagni agli utenti.
Sakana chiude con un ringraziamento agli utenti beta che hanno messo Fugu sotto stress reale. E con una promessa: questo è il punto di partenza, non la linea d’arrivo.
