Arriva SORA di OpenAI, per generare video da semplici istruzioni di testo

da | Feb 18, 2024 | Chat-GPT | 0 commenti

Sora di openAI

OpenAI ci sbalordisce ancora. Questa volta si tratta di SORA, uno strumento che genera video, partendo da semplici istruzioni di testo.

Forse non è chiaro quanto questo sia rivoluzionario, e desidero assicurarmi che il concetto sia compreso appieno. Alcuni potrebbero pensare a SORA come a una delle tante soluzioni che abbiamo visto nascere in questi ultimi mesi, tipo clip da scegliere e montare in una timeline video. Niente del genere.

SORA rappresenta un salto qualitativo: SORA è “crea un video di un bambino con la barba e gli occhi bianchi che gioca in un prato” e ottenere esattamente quello. 

Si comincia a capire la portata di questo strumento?

Cos’è SORA

Sora rappresenta un avanzato sistema di intelligenza artificiale progettato per creare video partendo da brevi comandi testuali. Questo modello possiede la capacità di produrre video di un minuto con una qualità elevata.

Sora si basa su una tecnologia all’avanguardia chiamata modello di diffusione, un approccio innovativo nell’ambito dell’intelligenza artificiale che adotta una strategia unica per “apprendere”. Questi modelli partono da contenuti netti, come foto o filmati, ai quali aggiungono progressivamente distorsione fino a che l’elemento originale diventa irriconoscibile.

La vera forza di questi sistemi risiede nella capacità di invertire il processo: apprendono a eliminare gradualmente la distorsione, ripristinando i dati originali passo dopo passo. Questo meccanismo dà vita a un’intelligenza artificiale capace di creare output estremamente realistici.

Anche Sora si avvale di GPT (la tecnologia alla base di ChatGPT) per trasformare comandi testuali semplici in descrizioni elaborate, ottimizzate per la produzione di video. In questo modo, anche le idee più concise possono essere convertite in contenuti visivi dettagliati e precisi.

Vediamo qualche esempio

Prompt:

La telecamera segue un SUV vintage bianco con un portapacchi nero mentre accelera su una ripida strada sterrata circondata da alberi di pino su un ripido pendio di montagna, la polvere si solleva dai suoi pneumatici, la luce del sole splende sul SUV mentre accelera la strada sterrata, proiettando una calda luce sulla scena. La strada sterrata curva dolcemente in lontananza, senza altre auto o veicoli in vista. Gli alberi su entrambi i lati della strada sono sequoie, con macchie di verde sparse ovunque. L’auto è vista da dietro mentre segue la curva con disinvoltura, facendo sembrare che stia guidando su un terreno accidentato. La strada sterrata stessa è circondata da ripide colline e montagne, con un cielo azzurro e limpido sopra con sottili nuvole.

Oppure:

Visita di una galleria d’arte con molte bellissime opere d’arte in stili diversi.

Su questa pagina trovi altri video generati da SORA, oltre alle informazioni relative allo strumento fornite direttamente da OpenAI.

Animare le immagini DALL- E

In aggiunta alla sua abilità di produrre video partendo da testi descrittivi, Sora può altresì creare video a partire da un’immagine fornita come input.

Con questa funzionalità, è possibile che Sora venga presto integrato in ChatGPT.

Limitazioni e considerazioni etiche

Come spiega OpenAI, anche con le sue notevoli competenze, Sora incontra ostacoli nell’emulare con precisione fenomeni fisici complessi e nell’interpretare intricati rapporti di causa ed effetto.

Ad esempio, il video qui sotto mostra che l’IA genera un movimento non plausibile.

Prompt:

Scena stampata di una persona che corre, film cinematografico girato in 35 mm.

Chi e quando può usare SORA di OpenAI

«Stiamo insegnando all’intelligenza artificiale a comprendere e simulare il mondo fisico in movimento, con l’obiettivo di addestrare modelli che aiutino le persone a risolvere problemi che richiedono interazioni nel mondo reale», si legge nella pagina di presentazione di Sora.

Attualmente, la durata massima dei video creati è limitata a un minuto. Questi possono essere prodotti utilizzando testo, un’immagine o una breve sequenza video che l’intelligenza artificiale è in grado di espandere.

Al momento, l’accesso a Sora è riservato esclusivamente a un gruppo ristretto di sviluppatori, artisti del settore visivo e registi.

«Condividiamo già ora i progressi della nostra ricerca per iniziare a lavorare e ricevere feedback da persone esterne a OpenAI e per dare al pubblico un’idea di quali capacità di intelligenza artificiale sono all’orizzonte», fa sapere l’azienda, che al momento non ha svelato una data di uscita ufficiale per il modello.

Considerazione finali

Appena un anno fa, eravamo all’oscuro di come l’intelligenza artificiale potesse trasformare radicalmente sia la nostra vita quotidiana che quella professionale. La sua versione iniziale ha già notevolmente accelerato i processi di produzione e le tecniche di creazione di contenuti. Tuttavia, il settore dell’AI è in continua evoluzione, mese dopo mese, attraverso innovazioni sia minori che maggiori, consolidando l’idea che avevo espresso in precedenza: se internet aveva moltiplicato la velocità dell’innovazione rispetto ai mercati tradizionali, l’intelligenza artificiale l’ha moltiplicata a sua volta rispetto ad internet.

Questo porta a una conclusione inevitabile: ignorare l’AI per un anno equivale a perdere un decennio di progresso nel business tradizionale.

Adesso, con l’avvento di SORA di OpenAI, persino il settore della produzione video, sebbene sia ancora nelle sue fasi iniziali, sta per essere rivoluzionato. Abbiamo tutti la capacità di immaginare storie, ma finora ci sono mancati gli strumenti e i budget necessari per realizzarle. Con strumenti come SORA, la situazione cambia radicalmente. Ognuno di noi, operando anche da un modesto studio domestico, può creare storie video in grado di competere con colossi come Pixar. Sebbene possa sembrare prematuro parlare di un tale cambiamento, data la rapidità con cui si susseguono le novità in questo ambito, non sarei sorpreso se entro la fine dell’anno i dirigenti e gli azionisti delle major cinematografiche iniziassero a preoccuparsi seriamente di una concorrenza finora sottovalutata.

Impara a sfruttare l’AI. Impara a utilizzare Chat GPT. Coloro che sono pronti ad accogliere il cambiamento e a cogliere le nuove opportunità non saranno mai lasciati indietro.

0 commenti

Invia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Dai un’occhiata al piano

Tutoraggio

Potresti essere in quella fase della tua vita dove il bisogno di cambiare è prepotente, e un percorso con me potrebbe rendere tutto più facile e veloce.

I lettori di questo articolo hanno letto anche:

Articoli Recenti