Google DeepMind ha rilasciato Veo 3.1 Lite, versione alleggerita del sistema di generazione video Veo 3. Il modello crea video ad alta risoluzione con audio partendo da prompt testuali o immagini di input.
Cos’è Veo 3.1 Lite
Veo 3.1 Lite appartiene alla famiglia Veo 3 – sistemi capaci di sintetizzare video di qualità da descrizioni testuali o immagini. Accetta come input stringhe di testo in linguaggio naturale (tipo “crea un video di un gatto che insegue una farfalla”) oppure immagini, e restituisce video ad alta risoluzione con audio sincronizzato.
L’architettura si basa su Veo 3, di cui rappresenta una versione ottimizzata per velocità ed efficienza. Google rimanda alla model card di Veo 3 per i dettagli tecnici su training dataset, processamento dati, hardware e software utilizzati.
Performance vs Veo 3.1 Fast
Google ha testato Veo 3.1 Lite confrontandolo con Veo 3.1 Fast su due modalità:
- T2V (text-to-video): 54.6% di win-rate su 1000 prompt testati
- I2V (image-to-video): 47.2% di win-rate su 646 prompt
Tradotto: nella generazione da testo Veo 3.1 Lite batte la versione Fast più della metà delle volte, mentre nella generazione da immagine resta leggermente indietro. Un trade-off ragionevole considerando che “Lite” di solito significa più veloce ma meno potente.
Dove trovarlo
Veo 3.1 Lite è disponibile attraverso:
- Gemini API
- Gemini AI Studio
- Google Cloud / Vertex AI
- Google Flow
- Google Workspace
L’accesso avviene via API, quindi zero sbattimenti per installare roba locale. Basta rispettare i termini di servizio delle rispettive piattaforme.
Sicurezza e limitazioni
Google conferma che Veo 3.1 Lite non mostra regressioni di sicurezza rispetto a Veo 3.1 base. Per tutto il resto – limitazioni note, uso accettabile, considerazioni etiche – rimandano alla documentazione di Veo 3.
Una nota interessante: la model card specifica che può essere aggiornata nel tempo per includere nuove valutazioni man mano che il modello viene migliorato. Approccio sensato per modelli in evoluzione continua.
