di Monica Gianotti
Meta annuncia Movie Gen, la nuova famiglia di modelli di intelligenza artificiale multimodale generativa in grado di creare video e audio a partire da richieste di testo. L’annuncio arriva diversi mesi dopo che il concorrente OpenAI ha presentato Sora, il suo modello text-to-video.
Oltre a generare nuovi filmati, Movie Gen può anche creare video personalizzati da immagini o prendere un video esistente e modificarne diversi elementi. Meta lo ha definito come “la sua terza ondata di lavoro sull’AI, che combina immagini, video, audio e modelli di animazione 3D”, spiegando di aver utilizzato un mix di “set di dati su licenza e disponibili pubblicamente” per addestrare il sistema.
L’azienda spera che “un giorno, in futuro, tutti avranno l’opportunità di dare vita alle proprie visioni artistiche e di creare video e audio ad alta definizione utilizzando Movie Gen”, sottolineando che non intende sostituire artisti e animatori ma “aiutare le persone a esprimersi in modi nuovi”.
Il Chief Product Officer di Meta, Chris Cox, ha scritto su Threads che l’azienda “non è pronta a rilasciare questo prodotto a breve, perché è ancora costoso e il tempo di generazione è troppo lungo”. “Volevamo condividere il punto in cui ci troviamo – ha scritto Cox – dato che i risultati stanno diventando piuttosto impressionanti.