L'evoluzione senza sosta dell'intelligenza artificiale ha come protagonista ancora una volta OpenAI che, dopo aver aperto le danze con ChatGPT ha lanciato un nuovo modello capace di creare video realistici e immaginativi a partire da istruzioni testuali. Si chiama Sora e promette di rivoluzionare il mondo della produzione video.
Come funziona Sora
Sora è un modello generalista di dati visivi: è in grado di generare video e immagini con durate, formati e risoluzioni diverse, fino a un minuto intero di video ad alta definizione. Basta scrivere una descrizione del contenuto desiderato e Sora si occupa di creare il video corrispondente.
Sora è in grado di creare scene complesse con più personaggi, tipi di movimento specifici e dettagli accurati del soggetto e dello sfondo. Il modello può anche capire come gli oggetti esistono nel mondo fisico, interpretare correttamente gli accessori e generare personaggi convincenti che esprimono emozioni vivaci.
Questo nuovo modello può anche generare un video a partire da un’immagine fissa, riempire i fotogrammi mancanti di un video esistente o estenderlo. Tra i video dimostrativi generati da Sora e pubblicati da OpenAI ci sono numerosi esempi che hanno lasciato tutti di stucco, per qualità e livello di dettaglio.
Molti hanno alcuni segni distintivi dell’AI, come un pavimento che si muove sospettosamente in un video di un museo, e OpenAI ammette che il modello potrebbe avere difficoltà a simulare accuratamente la fisica di una scena complessa, ma i risultati sono comunque abbastanza impressionanti.
Le potenzialità e i rischi di Sora
Sora è qualcosa che ci aspettavamo ma forse non così presto, e non con questo livello di dettaglio.
Il sistema è stato allenato con un numero indefinito di video grezzi che poi elabora a seconda delle necessità. Sora fornisce delle bozze a bassa risoluzione per poi esportare file fino alla risoluzione full HD, sia in orizzontale che in verticale o altri formati. E sarà anche in grado di creare video a partire da immagini, magari generate anche loro tramite intelligenza artificiale. Immaginate le ripercussioni: si potranno creare dei corti, magari dei film interi sfruttando b roll completamente fittizi. Questa si che è un’altra rivoluzione.
Ma come tutte le tecnologie, anche Sora ha dei rischi e delle sfide da affrontare. Come garantire l’autenticità e la veridicità dei video generati? Come prevenire usi illeciti o dannosi? Come proteggere i diritti d’autore e la privacy? OpenAI è consapevole di queste problematiche e per ora ha reso disponibile Sora solo a un gruppo ristretto di “red teamers” che stanno valutando il modello per potenziali danni e rischi. OpenAI offre anche l’accesso a alcuni artisti visivi, designer e filmmaker per ottenere feedback.
Questo mese, OpenAI ha annunciato di aver aggiunto dei watermark al suo strumento di testo-immagine DALL-E 3, ma nota che possono essere “facilmente rimossi”. Come per i suoi altri prodotti AI, OpenAI dovrà confrontarsi con le implicazioni etiche, legali e sociali della sua innovazione.