Ti rubo la faccia e la sostituisco alla mia

Facial Reenactement

Qui non si tratta semplicemente di sovrapporre le sembianze di una seconda persona alle proprie, o viceversa, creando la versione animata del più classico scherzo realizzato coi programmi di grafica per il PC. Né di una manuale rielaborazione del video effettuata con l’aiuto di un doppiatore, creata a posteriori da un artista che conoscendo a menadito tutti i manierismi di un politico, un capo di stato, o chicchessia, decidesse di creare il caos facendogli “pronunciare” parole inappropriate, verso questo o quel gruppo sociale. Bensì di un qualcosa di ancor più avanzato, e per certi versi, terribilmente inquietante. Un gruppo di studio composto da scienziati dell’Università di Erlangen-Nuremberg e dell’Istituto Max Planck per l’Informatica di Saarbrücken, assieme ad un collega ricercatore di Stanford, avevano infatti presentato lo scorso settembre alla conferenza sulla grafica SIGGRAPH Asia 2015 il prodotto di un lungo lavoro, che mirava a presentare nuovi metodi per simulare le espressioni ed il comportamento umano. Il loro video espositivo, ripubblicato proprio in questi giorni sul portale social Reddit e alcuni blog di settore, sta nuovamente facendo il giro del web. Tutto inizia usando come presupposto una domanda certamente insolita: sarebbe possibile, utilizzando due sensori RGB-D (si tratta di doppie telecamere con proiettore ad infrarossi in grado di percepire la profondità, come per intenderci il Kinect di Microsoft) ricostruire in diretta un modello tridimensionale di un volto, quindi sovrapporlo a quello vero, però controllandolo a distanza? Pensateci: è un qualcosa che, in effetti, nessuno aveva mai fatto prima. La scena della dimostrazione pratica potrebbe apparire poco innovativa, in un primo momento, ma una volta compresa ogni sua implicazione, vi apparirà sùbito come un punto di svolta significativo: ci sono due attori, posti l’uno a fianco dell’altro, ciascuno ripreso in primo piano e mostrato su uno schermo. Il primo resta totalmente impassibile, mentre il secondo fa ogni sorta di smorfia, parla, apre e chiude la bocca come un pesce. Mentre sugli schermi, guarda caso, tali movimenti vengono condotti da entrambi, in perfetta ed innegabile sincronia. Non è una registrazione, anche perché, ad un’analisi più approfondita, nel caso della faccia “telecomandata” c’è un ulteriore aspetto di assoluto quanto improbabile realismo, ovvero il fatto che gli spostamenti minori rispetto al punto di ripresa, la telecamerina ad infrarossi succitata, corrispondono incredibilmente a quelli dell’attore impassibile, colui che un tempo è nato con i simulati lineamenti. Che tuttavia, ormai appartengono al collega, almeno in video, per usarli a piacimento, almeno nel corso di alcuni brevi, potenzialmente drammatici minuti.
La descrizione del video, e con essa il testo tecnico di accompagnamento del progetto, liberamente disponibile sul sito di Stanford, propongono come di consueto alcune ipotesi di applicazioni future, tra cui quella dell’interpretariato simultaneo. Sarebbe in effetti possibile, teoricamente, impiegare il volto di un parlante originale per esempio giapponese, però sovrapponendogli in diretta la simulazione controllata dal traduttore per ottenere la perfetta sincronizzazione del labiale, non importa quanto possa essere diversa la lingua bersaglio della trasmissione televisiva dell’evento. Oppure, altra ipotesi, si potrebbe rappresentare se stessi, in giacca e cravatta dentro una stanza asettica per un colloquio a distanza, mentre in realtà ci si è appena svegliati e ci si trova ancora semi-sdraiati sul divano della propria disordinata abitazione. Ora, naturalmente, queste sono ipotesi piuttosto facéte, o ad ogni modo relativamente prive di effetti sulla vita quotidiana della gente. La realtà delle prototipazioni tecniche di ogni tipo, in questo stadio della loro progressione verso un prodotto vendibile al cliente e/o utile a governi ed aziende, è che ancora si tratta di proposte as-is (così come sono) prive di un senso e create semplicemente perché, come si dice: “potevamo farlo”. Ma una futura diffusione e l’ulteriore miglioramento di una simile tecnologia, come stavamo accennando in apertura, potrebbero portare a nuove, preoccupanti implicazioni…

FaceCage
Un’alternativa decisamente meno avanzata, nonché a basso costo, del software sviluppato per il SIGGRAPH potrebbe essere identificata nella popolare app per cellulari, Face Swap. In questo breve video, John Daly la usa per diventare Nicholas Cage. Perché chi non vorrebbe essere, Nicholas Cage?

Pensateci: è già un problema largamente diffuso, su Internet, quello dell’accertamento di una specifica provenienza delle informazioni. È in effetti assolutamente normale, su Twitter, Facebook o qualsiasi altro hub collettivo digitale, che per ciascuna persona famosa ci siano una media variabile dai due ai quattordici profili, più o meno credibili o evidentemente satirici. Nonostante questo, la gente si registra per seguirne uno a caso, e non sempre si tratta di quello reale. Nel frattempo siti di notizie evidentemente fasulle, come l’Onion statunitense o la controparte nostrana dell’assurdista Lercio.it, vengono costantemente ricondivisi da persone che magari non si preoccupano neanche di cliccare le folli storie lì proposte, che passando di profilo in profilo, alla fine riescono a trovare, incredibilmente, qualcuno che ci crede. Chiunque può presentarsi su un forum ad alta visibilità e annunciare, tra lo stupore e l’entusiasmo generale: “Sono il POTUS (Pres. degli Stati Uniti) fatemi qualsiasi domanda.” Oppure, sono il Papa, il Dalai Lama, sono Donald Trump. Ora, un sito rinomato e serio, del tipo che teoricamente potrebbe essere impiegato da figure pubbliche di primo piano (nel primo caso, è persino successo davvero, con Barack Obama che nel 2012 scelse di presentarsi agli utenti del già citato Reddit.com) giunto a quel punto ha già preso contatti con gli addetti del relativo entourage, confermando l’autenticità di quanto sta per essere affermato a nome del protagonista di giornata. Ma in casi meno eclatanti, ad esempio di un attore celebrato che scambiò chirurgicamente il suo volto con quello di John Travolta nella finzione scenica di un grande classico degli anni ’90, poté bastare persino una foto a convincere figure terze di quella possibile realtà. E che dire, allora, di un video simulato, in cui la persona in questione sembrasse magari rivolgersi al suo pubblico, confermando di aver creato il profilo in questione, trovandosi attualmente in procinto di rispondere ai quesiti della gente online, nel corso di un’ora fiammeggiante all’interno di un realistico studio ovale, un set di Hollywood, oppure perché no, la Pagoda tibetana dei 10.000 anni e così via… In questo secolo, non mancano di certo gli effetti speciali. Né le persone pronte a credere a una convincente evidenza, o per usare un’espressione tipica: “I loro stessi occhi”. Ovviamente, l’individuo colpito potrà procedere a smentire successivamente quanto è stato detto e fatto in quei momenti; ma siamo poi così sicuri, che verrebbe creduto?

Faceshift
Il concetto della mappatura del volto senza l’impiego di marker (i caratteristici puntini bianchi) ma grazie all’impiego di sensori RGB-D è alla base di un’intera nuova branca del motion capture facciale, generalmente sfruttata per la creazione di cartoni animati o videogame. Faceshift è un prodotto, citato anche in via comparativa nel video del SIGGRAPH, che generalmente riscuote molto successo tra il pubblico, come nel caso di questo video realizzato durante la Game Developers Conference di marzo del 2015.

La creazione di una simulazione completamente indistinguibile dalla realtà resta comunque piuttosto lontana al momento e, personalmente lo sospetto, forse anche più di quanto lascerebbe intendere il nostro strabiliante video di apertura. Non ci viene infatti mostrato, perché ovviamente avrebbe allungato eccessivamente i tempi, il probabile periodo di preparazione del programma, durante cui la faccia virtualizzata deve essere probabilmente ripresa da ogni lato, ed elaborata probabilmente anche con l’aiuto della mano umana. Mentre infatti resta indubbio che il computer riesca a realizzare l’effettiva simulazione grafica in tempo reale, non è impossibile che dietro possa esserci una lunga opera di preparazione, difficile da implementare nel caso in cui il soggetto “bersaglio”, ovvero proprietario della faccia da far muovere, non dovesse essere del tutto al corrente e collaborativo. Inoltre è anche vero che se si osservano attentamente la bocca e i denti del volto ricostruito, che dovranno necessariamente essere creati completamente al computer, non è impossibile notare alcune irregolarità nell’illuminazione e i movimenti. Mentre invece risultano davvero convincenti le rughe d’espressione, anch’esse completamente ricostruite ed aggiunte in post-processing dal sistema. O forse sarebbe meglio dire in questo caso, syncro-processing? C’era stato del resto lo scorso agosto un pregevole lavoro della Disney Research di Zurigo (altra assidua partecipante al SIGGRAPH) che si mostrava perfettamente in grado di creare un modello tridimensionale anche del volto di persone anziane, dai tratti quindi molto più complessi dei soggetti qui mostrati. L’unico limite, ormai, sembra essere la fantasia. Nonché, almeno per il momento, il semplice interporsi di un oggetto o una mano di fronte al volto bersaglio, interrompendone l’integrità agli occhi del sensore RGB-D. Potrebbe in effetti diventare un dire comune, nelle chat room video del futuro “Passati la mano di fronte alla faccia, per piacere!” Al fine di determinare se davvero, chi abbiamo di fronte, sia chi finge di essere attraverso il filtro dell’impersonale web.
Ma è difficile alla fine non pensare alla vicenda fantastica di una delle protagoniste del Trono di Spade, la serie Tv o perché no, quella dei romanzi, che trovatisi nelle distanti terre misteriose d’Oriente, si ritrova come adepta di un misterioso “Dio dai Mille Volti” nel cui tempio vengono custodite le facce, e quindi le identità, di innumerevoli defunti. Pronte da essere letteralmente indossate, grazie ad un’occulta stregoneria, dagli assassini facenti parte della setta in questione, al servizio di un concetto universale di giustizia oppure, a seconda dei casi, truculenta vendetta personale. Perché difficilmente, chi sceglie di occultare le sue sembianze, si sta apprestando a compiere dei gesti di cui andare fieri. E figuriamoci, addirittura, se dovesse scegliere di sostituirle con delle altre!

Lascia un commento