OpenMontage: 3000 stelle in una notte e l’AI video cambia tutto

Facciamo una scommessa. L’industria della generazione video AI sta per ribaltarsi completamente. E tutto per colpa — o merito — di un progetto open source e gratuito.

Sto parlando di OpenMontage, esploso su Github dalla metà di giugno come un fuoco d’artificio. 3000 stelle in una notte. Roba che nemmeno OpenClaw a marzo aveva fatto così veloce.

Cos’è davvero OpenMontage

Tutti i tool AI video che conosciamo — Sora, Runway, Kling, Pika — sono fondamentalmente generatori di clip. Gli dai un prompt, loro ti sputano fuori qualche secondo di footage. Materiale grezzo, insomma. Non un prodotto finito.

OpenMontage invece ti dà l’intero reparto produzione. Completo di sceneggiatore, regista, montatore e sound designer.

Gli dici ‘fammi un video da 60 secondi che spiega come si forma un buco nero’ e lui parte. Prima cerca informazioni online, trova le ricerche più recenti, individua le domande più frequenti del pubblico. Poi scrive la sceneggiatura, pianifica gli storyboard, calcola i costi. A quel punto ti chiede conferma: budget ok? Storyboard ok? Se approvi, continua.

Genera le immagini, trova i materiali, aggiunge la voce, sceglie la musica. Monta tutto automaticamente — transizioni, sottotitoli, color grading, mix audio. Infine si autocontrolla: frame neri? Audio sincronizzato? Sottotitoli precisi? Solo quando è soddisfatto ti consegna il prodotto finale.

È come avere Claude Code, ma per i video. Tu sei il cliente, OpenMontage è l’intera squadra dall’altra parte.

L’architettura sotto il cofano

Il cuore del sistema è una macchina a stati che orchestra l’intera produzione. Ogni fase ha standard precisi da rispettare prima di passare alla successiva. Tutto deterministico, niente improvvisazione.

Alla base c’è uno strato di adattamento model-agnostic. Tradotto: OpenMontage parla con 14 API di generazione video diverse, 10 modelli per immagini, 4 engine text-to-speech, modelli open source locali come WAN2.1, Hunyuan e CogVideo, persino archivi di materiali gratuiti. Tutto unificato sotto un’interfaccia comune.

Per il sistema non importa quale modello stai usando. Sceglie automaticamente quello più adatto in base al tipo di inquadratura e al budget disponibile.

Lo strato intermedio contiene 52 strumenti specializzati. C’è il fact-checker che verifica le informazioni online, l’analizzatore di inquadrature che estrae frame e identifica tipo di shot, transizioni, ritmo, pause vocali. C’è un motore di montaggio programmato basato su Remotion e FFmpeg. Eccetera.

Sopra tutto questo ci sono i workflow. Definiscono quante fonti consultare nella fase di ricerca, che struttura deve avere lo script, quali campi deve contenere ogni inquadratura dello storyboard, quando rigettare una bozza, quale livello di modello usare per ogni tipo di scena.

L’intero processo gira dentro un ‘Director Loop’. Dal momento in cui inserisci la richiesta, il sistema avanza automaticamente: ricerca → script → storyboard → pianificazione asset → generazione → montaggio → quality check. Ogni fase ha criteri di accettazione chiari.

Quanto costa davvero

Gli altri tool ti danno un cameraman eccezionale, ma devi fare tu il regista, lo sceneggiatore, il montatore, il produttore. OpenMontage ti porta una troupe già rodata. Devi solo dire cosa vuoi girare.

E come OpenClaw, puoi cambiare modello a piacimento. Hai le chiavi API di Kling? Usa quelle. Hai Runway? Perfetto.

E se hai i token ma non hai materiali? Nessun problema. OpenMontage usa generatori di immagini gratuiti con animazioni per riempire le scene. Oppure pesca da Archive.org, NASA, Wikipedia — archivi completamente liberi — per trovare footage storici, documentari, materiale reale da montare.

La demo ufficiale mostra un cortometraggio animato di 60 secondi in stile Pixar, con personaggi, trama, voce e sottotitoli. Costo totale: 1,33 dollari. C’è anche uno spot pubblicitario prodotto solo con una chiave OpenAI: 0,69 dollari. E un video in stile documentario fatto interamente con materiali gratuiti e voiceover locale: zero dollari.

Il trucco che cambia tutto

C’è un dettaglio che tutti hanno ignorato: OpenMontage lavora ‘reference-driven’, non ‘prompt-driven’.

Significa che non devi scrivere ‘cinematografico, 4K, golden hour, profondità di campo, obiettivo 85mm’ e tutta quella roba da prompt engineer.

Gli mandi direttamente il link di un video TikTok o un reel che ti piace e gli dici ‘fammi una cosa simile come ritmo, ma che parli di computazione quantistica’. Lui analizza automaticamente il ritmo, gli hook, la struttura, il linguaggio visivo del riferimento. Poi ti propone alcune opzioni, spiega cosa ha tenuto e cosa ha cambiato, quanto costa, che risultato aspettarti.

Non sei un ingegnere di prompt. Sei semplicemente il cliente.

Perché è esploso proprio ora

Il creatore di OpenMontage è Calesthio AI Labs. Prima di questo progetto, Calesthio aveva già pubblicato diversi tool open source: Crucix, un agent per intelligence personale con 10.300 stelle, poi BreakoutAnalysis, OptionsCanvas per il trading di opzioni, SessionAnchor per la memoria contestuale di Claude Code.

OpenMontage è nato su Github a marzo. Ma è esploso solo a fine giugno. Perché?

All’inizio era solo un framework, un’idea di come si potesse generare video tramite agent. Non eseguiva davvero nulla. A giugno, Calesthio ha committato 23 aggiornamenti e integrato 15 pull request dalla community. Solo allora OpenMontage è diventato quello che è oggi.

Dal 22 al 26 giugno, il progetto ha guadagnato oltre 3000 stelle al giorno. Una traiettoria simile a quella di OpenClaw a marzo.

Un altro motivo del successo: il README è scritto in modo brillante. La maggior parte dei progetti tech parte con dipendenze, istruzioni di installazione, roba noiosa. OpenMontage mette subito in cima i video generati e i prompt usati. Guardi e capisci subito se funziona o no.

Poi mostra una serie di esempi, ognuno con metodo di produzione e costo dettagliato.

E il 24 giugno, Calesthio ha riscritto l’intero README in cinese. L’intento è piuttosto chiaro: il mercato cinese della video AI è enorme.

Il prima e il dopo

Prima di OpenMontage, generare video AI era un incubo logistico.

Primo: scegliere la piattaforma. Sora? Serve abbonamento ChatGPT, code interminabili, mezz’ora per 10 secondi di video, risultati instabili. Runway? Decine di euro per un minuto, poi devi scaricare tutto manualmente.

Secondo: una volta generati i clip, inizia il calvario. Scarichi tutto, apri CapCut o Premiere, monti pezzo per pezzo. Scrivi tu il copy, registri tu la voce, cerchi tu la musica di sottofondo.

Seedance 2.0, Kling e Sora 2 hanno provato ad aggiungere audio automatico e generazione guidata dai materiali. Ma tra problemi di compliance e qualità variabile, alla fine devi comunque mettere mano al montaggio.

E se vuoi provare un altro modello con lo stesso prompt e gli stessi materiali? Riparti da zero. Tutto daccapo.

In sostanza, l’AI video finora era un ‘parco giochi delle big tech con biglietto d’ingresso’. Vuoi entrare? Segui le nostre regole, compra il nostro pass, usiamo le attrazioni che decidiamo noi. E no, non puoi portare snack da fuori.

OpenMontage rovescia il tavolo. È gratuito, open source, e il controllo dei materiali è tutto tuo.

Ha riportato il potere decisionale dalle grandi aziende agli utenti.

Un’industria sul punto di saltare

Qualcuno dirà: è solo un tool open source, che esagerazione.

Ma OpenMontage cambia completamente la dimensione competitiva del settore. Proprio come il salto dall’era dei chatbot a quella degli agent.

Fino a ieri tutti facevano a gara su chi aveva il modello migliore, la qualità più alta, la durata più lunga, la fisica più realistica.

Ora improvvisamente qualcuno ti dice: queste sono solo capacità di base, il biglietto d’ingresso. Io sono l’utente, voglio il prodotto finito, non i materiali grezzi. Quindi smettete di competere su quello, voglio vedere chi fa il montaggio migliore, lo storyboard migliore.

È come l’industria degli smartphone. Anni fa tutti gareggiavano su processori e megapixel. Ora che i processori sono abbastanza potenti, la gara si è spostata su sistema operativo, algoritmi fotografici, velocità di ricarica, esperienza utente complessiva.

Il settore della generazione video sta per entrare in questa fase.

Da oggi in poi, se esce un nuovo modello che genera 10 secondi di video in 8K, nessuno si stupirà più. La domanda sarà: si integra con OpenMontage? Quanto costa al secondo? Che vantaggi ha rispetto agli altri?

E il mondo del video professionale?

C’è anche un impatto laterale: l’industria della produzione video professionale sta per essere sconvolta.

Molti dicono che l’AI non potrà mai sostituire montatori e registi. Vero, i grandi maestri non saranno mai rimpiazzabili. Ma il 90% della produzione video di fascia medio-bassa? Quella sì, rischia grosso.

Quando uscì Meitu, dissero che non avrebbe mai sostituito gli studi fotografici. Quando uscì CapCut, dissero che non avrebbe mai sostituito i montatori professionisti.

La storia è sempre la stessa. All’inizio la nuova tecnologia sembra un giocattolo. Poi un giorno ti accorgi che fa già tutto quello che facevi tu.

Ma funziona davvero?

Diciamoci la verità. Durante i test ho trovato parecchi bug. Molte funzioni non sono ancora perfette. I video prodotti non raggiungono sempre standard professionali.

Però. La forza dell’open source non è partire perfetti. È che una volta che il progetto decolla, c’è gente da tutto il mondo che contribuisce. E la velocità di sviluppo supera qualsiasi immaginazione.

Soprattutto quando il potenziale è così evidente.