Google ha appena portato le Interactions API in versione stabile. E no, non è l’ennesimo restyling cosmetico — è il nuovo standard per lavorare con Gemini.
Dal beta di dicembre 2025 a oggi, l’API è diventata il modo preferito dagli sviluppatori per costruire applicazioni con Gemini. E si capisce perché: un unico endpoint per tutto. Modelli, agenti, esecuzione in background, strumenti combinati, generazione multimodale. Tutto in poche righe di codice.
Cosa c’è di nuovo rispetto a dicembre
La lista è lunga, ma partiamo dai pezzi grossi.
Managed Agents: una singola chiamata API ti crea una sandbox Linux remota dove l’agente può ragionare, eseguire codice, navigare il web e gestire file. L’agente Antigravity è quello di default, ma puoi definire i tuoi agenti custom con istruzioni, competenze e fonti dati specifiche.
Esecuzione in background: basta aggiungere background=True nella chiamata. Il server esegue l’interazione in modo asincrono. Semplice, pulito.
Strumenti migliorati: ora puoi combinare tool integrati — tipo Google Search o Google Maps — con le tue funzioni custom in un’unica richiesta. E i risultati dei tool possono restituire immagini insieme al testo, non solo stringhe.
Deep Research potenziato: due nuove versioni dell’agente (velocità vs. profondità), pianificazione collaborativa, grafici e infografiche nativi, e grounding multimodale con immagini, PDF e audio.
Generazione media: immagini con Nano Banana 2 e grounding su Google Image Search, musica con Lyria 3, e sintesi vocale espressiva con TTS multi-speaker. Sì, quella roba che finora sembrava magia nera ora è un parametro nell’API.
Da Roles a Steps: schema più pulito
Hanno semplificato lo schema. Ogni azione — user_input, thought, function_call, model_output — è ora un ‘step’ tipizzato. Via la vecchia struttura basata sui ruoli. È più lineare, più facile da debuggare.
Ottimizzazioni di costo e latenza
Hanno introdotto i tier Flex e Priority. Flex ti dà una riduzione del 50% sui costi. Priority punta sulla latenza. Gli errori ora ti indicano esattamente quale campo è il problema. E le interazioni passate sono recuperabili con retention di 55 giorni sul piano a pagamento.
Tradotto: meno tempo a litigare con log generici, più tempo a costruire.
Il nuovo standard (ma il vecchio resta)
Le Interactions API sono ora il default per Google AI Studio, l’API Gemini e tutta la documentazione. C’è un toggle per tornare al formato legacy, se proprio ne hai bisogno.
La vecchia API generateContent continuerà a funzionare e riceverà i nuovi modelli Gemini mainline. Ma — ed è un ‘ma’ importante — le capacità frontier per modelli e agenti a lunga esecuzione arriveranno sempre più spesso solo sulle Interactions API. Perché? Perché è stata progettata da zero per workflow stateful e agentici.
Hanno pubblicato una guida alla migrazione se vuoi passare con calma. Nessuna fretta, ma la direzione è chiara.
Un ecosistema pensato per gli agenti
La maggior parte degli sviluppatori usa ormai agenti di coding come Antigravity per costruire applicazioni. Per rendere più facile agli agenti rimanere aggiornati con i pattern API più recenti, Google ha creato la gemini-interactions-api Skill. Inietta best practice nel contesto dell’agente: streaming, function calling, output strutturato, Deep Research e altro.
Già integrato con LiteLLM, Eigent e Agno. SDK disponibili per Python e JavaScript.
Come iniziare
Prendi la tua API key da Google AI Studio, segui la documentazione delle Interactions API e sei operativo. Se stai migrando da generateContent, la guida ti mappa ogni campo al nuovo schema. C’è anche il reference completo dell’API.
Le Interactions API sono nate dal feedback degli sviluppatori. E continueranno ad evolversi così, anche dopo la GA. Se hai richieste o problemi, c’è il forum degli sviluppatori.
Insomma: un unico endpoint, meno complessità, più potenza. Esattamente quello che serve quando gli agenti diventano il modo normale di costruire software.
