L'Intelligenza Artificiale sta permeando molti settori e quello della fotografia è in prima linea. Giganti database di immagini e algoritmi di machine learning possono essere utilizzati per gli scopi più disparati, dal riconoscimento avanzato delle scene (compito abbastanza facile), al riempimento contestuale di porzioni di immagini, fino ad arrivare all'ultima applicazione proposta da Facebook. Quella che risolve l'annoso problema delle foto di soggetti con gli occhi chiusi.
Sbattiamo gli occhi molte volte al minuto e quando siamo i soggetti di una fotografia può capitare spesso che l'otturatore scatti proprio nell'instante in cui noi abbiamo gli occhi chiusi. Per i soggetti singoli spesso basta una rapida raffica per arginare il problema ma, come ben sanno i matrimonialisti, riuscire a scattare una foto di gruppo in cui nessuno abbia gli occhi chiusi è un'impresa titanica.
Facebook ha sviluppato una tecnologia che affronta di petto il problema, partendo da un punto preciso: esistono diverse tecniche di manipolazione, ma il nostro cervello è molto sensibile agli errori, anche minimi, sui volti, soprattutto se conosciuti. Il documento in cui i ricercatori presentano il progetto introduce diversi concetti complessi, partendo dall'analisi dei risultati ottenuti con sistemi come le deep convolutional networks (DNNs), e sottolineando come l'approccio delle Generative adversarial networks (GANs), possa garantire risultati migliori nello specifico campo di applicazione.
Una versione più raffinata di quest'ultima tecnica la Exemplar GANs (ExGANs), utilizzando informazioni extra, è quella adottata dai ricercatori di Facebook, che partono dal fatto che ogni utente Facebook ha spesso un database abbastanza ricco dei soggetti di maggiore vicinanza, da cui l'Intelligenza Artificiale può attingere informazioni per mantenere la 'semantica' delle immagini e creare occhi aperti personalizzati, che tengano conto delle unicità della persona ritratta.
Altre tecniche, infatti, utilizzando un approccio più generale, introducono difetti nelle tonalità della pelle e degli occhi e non sempre i risultati sono coerenti con la posa e la direzione naturale dello sguardo. Il documento dei ricercatori scende molto nel dettaglio delle equazioni utilizzate e in concetti come Content loss vs. Perceptual loss. Dettagli tecnici a parte i risultati sono impressionanti, soprattutto se messi a confronto con quelli, di approccio diverso, della simile funzione di Adobe Photoshop. I ricercatori dichiarano che essendo le Exemplar GANs dei framework di tipo generale, le loro potenzialità sono applicabili anche ad altri campi, come il riempimento di porzioni mancanti delle immagini.
Voi cosa ne pensate? Vi piacerebbe aprire magicamente gli occhi di tutti i soggetti delle vostre foto su Facebook o trovereste la cosa un po' inquietante?