Creare video con una foto o immagine
In questo articolo

Animare una foto o una immagine? Fino a poco tempo fa questo poteva sembrare fantascienza, o comunque un lavoro fattibile solo per “gli addetti ai lavori”, ma ora con l’IA (Intelligenza artificiale, IA per gli anglofoni) che sta entrando a gamba tesa nelle nostre vite non solo è diventato fattibile, ma persino semplice!

Content Creator e addetti alla pubblicità di ogni campo si stanno già sfregando le mani, ma di cosa si tratta e quali strumenti dobbiamo utilizzare per animare una foto?

Per lo scopo di questo articolo, volendo utilizzare il più possibile L’IA in tutti i campi possibili, creeremo un video generando:

  1. Un testo tramite Chat GPT
  2. Un immagine usando l’intelligenza artificiale di Midjourney
  3. Il parlato utilizzando un sintetizzatore vocale
  4. Il video in cui l’avatar creato da noi scandirà le parole

 

Lo script

Che sia un video promozionale, informativo o ludico, senza uno script non andremo molto lontano. Il nostro obiettivo sarà quello di presentare una ragazza di nome “Karma” che si fingerà il nostro assistente virtuale e ci parlerà di alcune delle sue peculiarità.

Per aiutarci nella creazione del dialogo utilizzeremo l’ormai famosissimo ChatGPT, se non sai di cosa stiamo parlando ( davvero non lo sai? ) ti rimandiamo al nostro articolo: https://www.karmadesignstudio.it/10-vantaggi-e-svantaggi-di-chatgpt/

Comunque per riassumere, ChatGPT è un modello di linguaggio sviluppato da OpenAI addestrato utilizzando la tecnologia Deep Learning ed è in grado di rispondere a un infinita mole di domande e conversare in modo naturale.

Dopo qualche aggiustamento per rendere il testo più empatico e piccoli accorgimenti manuali siamo arrivati a un testo abbastanza convincente in cui la nostra assistente virtuale cerca di porsi nel modo più naturale possibile.  (Il testo del dialogo sarà reperibile nelle immagine successive).

 

Creiamo la nostra assistente con Midjourney

Passiamo ora alla creazione vera e propria di “Karma” la nostra assistente virtuale. Questo passaggio ovviamente è facoltativo, nulla ci vieta di prendere una immagine da internet o di usare una vera e propria foto.

Per la sua creazione ci affideremo a Midjourney che come ChatGPT funziona attraverso l’invio di comandi, detti prompt che gli permettono di generare delle immagini totalmente nuove.

Ma come funziona Midjourney nella pratica?

Midjourney funziona tramite bot sul server Discord ufficiale, raggiungibile dalla pagina Midjourney Sito Web oppure tramite link di invito https://discord.com/invite/midjourney

Per creare la nostra immagine dovremo quindi selezionare uno dei canali newbies nella colonna di sinistra. Questi canali sono accessibili da tutti i nuovi iscritti e si presentano come una normale chat discord. Al suo interno noteremo che altre persone stanno già generando le loro immagini inserendo i loro input.

Si tutto bello, ma si paga?

Appena iscritti avremo 25 crediti gratuiti che grossomodo sono pari alla creazione di 25 immagini. Il calcolo non è definibile in maniera corretta in quanto i crediti non equivalgono al numero di immagini che andremo a richiedere, ma al tempo che il sistema dedicherà al rendering delle nostre immagini. Finiti i crediti dovremo quindi acquistare uno dei piani a pagamento consultabili sul sito di Midjourney.

Tornando a noi, per inviare i comandi al bot in modo corretto, basterà inserire il comando /imagine seguito dai vostri comandi.

Esempio di struttura:

/imagine prompt LINK PER REFERENCE, TESTO DESCRITTIVO, PARAMETRI TECNICI

Dove il LINK PER REFERENCE sarà dove se ne necessitiamo, possiamo inserire il link di un’immagine da usare come riferimento. Il TESTO DESCRITTIVO non è altro che la nostra descrizione di cosa vogliamo venga rappresentato all’interno dell’immagine, mentre nei PARAMETRI TENICI possiamo andare ad inserire prompt specifici definiti appunto tecnici che riguardano le proporzioni della nostra immagine, se vogliamo rimuovere parti di essa, aggiungere filtri e molto altro.

Per lo scopo di questa guida questo è un argomento troppo vasto e in continuo aggiornamento, vi sono molte pagine web che spiegano in modo approfondito i comandi e le loro funzionalità, noi vi consigliamo anche di guardare nella chat Discord i prompt degli altri utenti, così da poter prendere spunto. Se mastichi un po’ di inglese puoi trovare qualche spunto seguendo questa guida: QUI 

Non preoccuparti però, se non vuoi arrovellarti nel cercare terminologie tecniche il bot capisce benissimo anche descrizioni molto generali.

Ecco il nostro semplice prompt:

/Imagine prompt face, girl, ultra-detailed, beautifull, 8k, ultra-realistic, red hair

Grazie al quale abbiamo chiesto al bot di rappresentarci un volto di una ragazza (NB. Il volto deve essere rappresentato il più frontale possibile, sennò si rischierà di avere problemi in seguito) di bell’aspetto, con capelli rossi aggiungendo infine qualche indicazione per garantirci un risultato il più possibile realistico.

 

Creazione immagine tramite Midjourney
Il bot genera l’immagine

 

Inserito il comando, il bot inizierà il rendering dell’immagine che ci verrà fornita in una griglia 2×2 con al suo interno quattro rappresentazioni di quello che abbiamo chiesto.

Come potete vedere il risultato è già da lasciare a bocca aperta.

Sotto la griglia ora si potranno notare una fila di pulsanti.

U1, U2, U3 e U4 che permettono di effettuare l’upscaling (ingrandimento dell’immagine di riferimento) partendo dalla prima in alto a sinistra, passando poi a quella in alto a destra, in basso a sinistra e in basso a destra.

V1, V2, V3 e V4 sono invece i pulsanti adibiti alla creazione delle varianti delle corrispettive immagini.

Per il nostro scopo sceglieremo di fare un upscaling della terza immagine U3. La scarichiamo e passiamo alla fase successiva per creare un video con l’IA.

 

Viso generato con Midjourney
Karma prende vita

 

Passiamo ora ad animare la nostra immagine

Per creare un video con una foto o immagine che sia dobbiamo trovare il modo di animarla.

Passiamo ora quindi all’ultima parte del nostro processo di creazione. Iniziando dalla generazione della voce tramite testo (text-to-speach).

Online si trovano molti software che ci permettono di assolvere a questo compito, alcuni offrono periodi di prova, altri voci limitate.

Noi utilizzeremo il sintetizzatore vocale implementato nello stesso tool che ci permetterà la creazione vera e propria del nostro video, cioè: D-ID (D-ID’s generative AI technology) raggiungibile alla pagina https://studio.d-id.com/ che ci permetterà iscrivendoci alla Trial di avere 20 crediti gratuiti per la creazione dei nostri video. Finiti, occorrerà passare ad un piano a pagamento.

Questo potentissimo software ci permetterà di copiare il nostro testo, scegliere la lingua e il tipo di voce che più ci aggrada tra quelle selezionabili nell’elenco.

 

D-ID inserimento testo
Inseriamo testo e avatar

 

Trovata la voce che più rispecchia la nostra assistente virtuale, basterà o usare uno dei preset che ci fornisce il sito, oppure, come nel nostro caso, caricare l’immagine creata con Midjourney. Unica cosa importante è che il viso sia chiaramente visibile e che guardi nella vostra direzione, in modo che il software possa procedere nella creazione senza intoppi.

A questo punto il gioco è fatto e la nostra guida su come creare video con una foto o immagine è terminata. Clicchiamo sul pulsante in alto a destra e ci gustiamo il risultato del video creato con l’IA che potrete visionare qui sotto.

 

Risultato finale

 

Come sempre speriamo di esservi stati utili e di avervi fatto scoprire qualcosa di nuovo, ci ritroviamo sempre qui sul nostro Kuestion nel prossimo articolo.

 

 

VHosting.it

Articoli Correlati