Le informazioni dentro le immagini (scopriamole)
Abbiamo giocato con quello che un'AI VEDE dentro delle fotografie, e vi facciamo scoprire alcune cose che forse non avevate valutato o considerato.
Una delle maggiori problematiche dell’innovazione è quella di non sapere cosa effettivamente l’innovazione stessa può fare per noi. Di fatto, se ne percepisce solo il confine superficiale, magari anche e sono quello che magari conferma o contrasta con la nostra visione. E troppo spesso, le persone si fanno delle opinioni che sentenziano il loro rapporto con queste nuove soluzioni.
Se prendiamo la capacità dell’AI di creare, analizzare, comprendere le immagini, siamo sicuri che alcuni fotografi non hanno nemmeno ancora sposato non tanto o non solo la generazione e la correzione delle immagini con l’intelligenza artificiale (e, secondo noi, dovrebbero farlo con maggiore fiducia e curiosità), non hanno nemmeno valutato che queste potenzialità possono risultare molto utili anche solo per scoprire “cosa c’è dentro un’immagine”.
Pensiamo a “dettagli” che sono contenuti nelle immagini , oppure anche dettagli che “hanno permesso di realizzare quell’immagine”. ed pensiamo possa essere affascinante scoprirlo, per chi di professione lavora proprio con questo ingrediente. Per questo vi mostriamo un paio di esempi, che forse sono interessanti.
Il dettaglio è che per fare questi test serve ChatGPT nella sua versione a pagamento (20 dollari/mese), ma una delle cose che forse dobbiamo capire è che qualche piattaforma di AI finiremo per pagarla tutti (in un modo o nell’altro, in una versione o nell’altra… integrata o esterna ad altre piattaforme che usiamo), ma per ora vi raccontiamo queste cose per cultura e sapere generale, poi valutate voi: di sicuro non varrà l’investimento di 20 dollari al mese quello che vi mostreremo, ma forse vi farà capire come usare l’AI in modo più integrato alla nostra vita e alle nostre esigenze.
Localizzazione
E’ chiaro che se andiamo in giro e vogliamo localizzarci, apriamo Google Maps o Apple Mappe e siamo a posto, così come se vogliamo sapere qualcosa di un palazzo o di un luogo possiamo scoprirlo facilmente andando sui dettagli di quello che abbiamo “attorno a noi”, sempre sugli stessi strumenti, ma se abbiamo una fotografia, come facciamo a sapere dove è stata scattata? Specialmente se … non ci sono i dati Exif per scoprirlo? Bene, questa funzione si può avere appunto usando ChatGPT usando il modello di intelligenza chiamato o3 (o… come la lettera O, non come zero, come qualche finto esperto dichiara)
Nella versione a pagamento, infatti, si può scegliere, come da screenshot dal telefono, si possono scegliere i vari modelli, e noi abbiamo evidenziato proprio o3 che è uno di quelli più interessanti in assoluto perché “ragiona”. Di fatto, invece che rispondere in pochi secondi, come fa chiunque che risponde un po’ a caso, questo modello “pensa”, “ragiona”, si prende del tempo per capire, per esplorare varie opzioni, e dopo qualche secondo, ma a volte anche dopo diversi minuti, ci fornisce una analisi che è decisamente più raffinata di quello che siamo abituati ad ottenere dalla ricerca “standard” (quindi anche quella gratuita).
Per prima prova abbiamo provato a chiedergli la localizzazione di una fotografia scattata vicino a casa nostra, che aveva certo delle “tracce” che aiutavano a capire, ma è molto interessante la risposta che vi riportiamo qui sotto;
Ecco cosa ci ha risposto:
Qui il testo completo della risposta:
Quel palazzo in bugnato grigio‑cenere, coronato da ringhiere Liberty piene di gerani, appartiene al fronte ovest di viale Abruzzi. L’inquadratura rivela due targhe toponomastiche: quella principale recita «viale Abruzzi», l’altra – un poco defilata, quasi nascosta dal cartello di senso vietato – indica «via Paracelso». È dunque il crocevia fra queste due strade, nel quadrante est di Milano, a una manciata di minuti a piedi da piazzale Loreto e da corso Buenos Aires.
Il locale al piano terreno, con l’insegna azzurra «Mondocopia – Copy Center», è un indizio decisivo: la copisteria dichiara sul proprio sito di trovarsi «viale Abruzzi 43, angolo via Paracelso» . Il numero civico e la posizione d’angolo coincidono perfettamente con la scena fotografata, comprese le tapparelle abbassate e i graffiti che incorniciano l’ingresso.
Geograficamente il punto cade a circa 45,479° N di latitudine e 9,213° E di longitudine, nel quartiere compreso fra Porta Venezia e Città Studi. La zona è servita dalle linee metropolitane M1 (stazione Lima) e M2 (stazione Loreto) nonché dall’autobus 92, che scorre proprio sotto quei balconi di ghisa .
Se volessi verificare di persona, basta uscire alla fermata Lima, percorrere in leggera discesa il controviale di viale Abruzzi e, dopo poco più di cinquecento metri, ti troverai esattamente sullo spartitraffico da cui è stata scattata la foto: davanti, l’angolo in pietra grigia scolpita; a destra, la facciata giallo ocra di via Paracelso con le sue fioriere pensili; in primo piano, un coro di cartelli di senso vietato che segnano l’imbocco della corsia preferenziale. Un piccolo frammento di Milano novecentesca, ancora fedele al reticolo ortogonale della “circonvalla” interna, che la città ha imparato ad amare proprio per dettagli come questi.
Osservazione di montagne
Abbiamo fatto un altro test, e qui i problemi sono venuti fuori, perché effettivamente abbiamo mandato in crisi il sistema che, guardando semplicemente delle montagne, senza alcuna indicazione, senza alcuna scritta, senza alcun aiuto, ha capito solo parzialmente la zona. Ecco l’immagine:
Ammettiamolo, è difficile… il sistema ci ha quindi messo oltre 5 minuti e anche se è arrivato a qualcosa di “credibile”, come zona (erano sempre Dolomiti) di fatto ha sbagliato, A quel punto, lo abbimo messo sotto pressione chiedendo… ma questa montagna si vede da Trento? E ha risposto che sarebbe stato molto (troppo difficile) e quindi se effettivamente era stata scattata a Trento, la risposta è cambiata (con scuse e le motivazioni dell’errore, che sono comunque molto interessanti, secondo noi), le riportiamo qui sotto:
RISPOSTA CORRETTA:
Hai ragione: se lo scatto arriva davvero da Trento (basta affacciarsi da sud‑est della città, oppure percorrere l’A22 verso nord all’altezza di Mattarello) la montagna che occupa la parte sinistra dell’inquadratura non può essere il Col Visentin. Quella parete calcarea, giallo‑grigia, che s’innalza quasi a picco sul fondovalle con una cresta spoglia su cui sono piantati pochi tralicci sottili, corrisponde invece alla cima Palon (2.090 m), vetta principale del Monte Bondone, cioè la “montagna di casa” dei trentini.
L’equivoco nasce dal fatto che, vista di tre quarti attraverso l’aria tersa invernale, la sagoma del Palon ricorda la piramide prealpina del Visentin; ma alcuni dettagli la tradiscono:
L’ubicazione: il Palon sta subito a ovest della città (45°59′ N 11°01′ E) , e dalla periferia sud di Trento lo si osserva proprio con la stessa prospettiva del tuo scatto, mentre il Visentin è 90 km più a est.
La falesia orientale: è la parete che “domina direttamente Trento”, come ricorda la guida locale del rifugio Montana ; la ruvida superficie carbonatica, striata di canaloni neri, coincide con quella che appare nella tua foto.
Il modesto impianto di telecomunicazioni: sul Palon, a differenza del Visentin, i ripetitori sono pochi e disposti in fila sopra la cresta; nel tuo ingrandimento si distinguono proprio quei cinque‑sei pennoni sottili senza il grande radome cilindrico che caratterizza, ad esempio, il vicino dosso della Viote.
Il rilievo bruno in primo piano a destra è il contrafforte boscoso che da Vaneze sale verso Costa dei Cavai: quota intorno ai 1.600 m, troppo basso per trattenere la neve di inizio stagione, perciò rimane quasi completamente nudo mentre la vetta, 500 m più su, è già imbiancata.
In sintesi: lo scatto immortala il versante orientale del Monte Bondone con la cima Palon al centro della scena, visto da sud della conca di Trento.
Mi scuso per l’errore precedente; l’occhio, in questo caso, aveva giocato a nascondino con la geografia.
Applicazioni più “serie”
Pensiamo ad una applicazione più concreta in ambito professionale: siete al lavoro per trovare una location, un luogo per un determinato shooting, date un’occhiata su Pinterest, oppure altrove, e trovate un eccellente “scorcio” per quello che avete in mente… ma magari non avete idea di dove sia. Proviamo?
(immagine realizzata da Josh Hild su Unsplash)
Questa immagine potrebbe essere interessante, ma la location potrebbe non essere facile da identificare. Abbiamo quindi provato a chiedere a ChatGPT, sempre usando il modello o3, ed ecco la risposta:
e qui tutti i dettagli della risposta di ChatGPT:
ci troviamo a seattle, nel tratto di post alley inglobato nel complesso residenziale–commerciale harbor steps, un passaggio pedonale che collega la waterfront al cuore di downtown fra western avenue e first avenue. il cartiglio “post alley at harbor steps” che domina la scena è montato sul ponte metallico che unisce i due corpi degli edifici harbor steps; appena a sinistra spunta l’insegna di locust cider & brewing co. (1222 post alley), mentre a destra si legge “la pérgola seattle”, ristorante affacciato sulla stessa corte. entrambe le attività, documentate dagli elenchi e dalle guide locali, confermano in modo puntuale la collocazione .
l’inquadratura è stata realizzata dalla terrazza superiore di harbor steps, probabilmente all’altezza di university street, puntando verso sud lungo l’asse del vicolo. la scelta di un teleobiettivo corto comprime i vari livelli di passerelle e travi, facendo risaltare la successione di archi, corrimani e passerelle metalliche che caratterizzano l’architettura del sito. sul fondo, fra i pilastri blu petrolio del complesso, si intravede l’uscita sulla carreggiata in leggera pendenza che scende verso il lungomare.
il pavimento lucido in primo piano tradisce una pioggia appena cessata, tipica del microclima puget sound: le mattonelle bagnate riflettono il reticolo di travi e conferiscono alla scena una tavolozza fredda che vira dal ciano al grigio ardesia. il cielo nuvoloso agisce come un gigantesco soft-box, distribuendo una luce diffusa che riduce al minimo le ombre dure; l’immagine ottiene così un contrasto moderato che esalta i dettagli strutturali senza sacrificare le alte luci del cielo né affogare i neri nelle zone d’ombra del vicolo.
in sintesi, ciò che vediamo è un frammento assai riconoscibile del centro di seattle: quel segmento di post alley che, a poche centinaia di metri dal gum wall di pike place market, attraversa il complesso harbor steps diventando un piccolo canyon urbano di passerelle, insegne e superfici riflettenti.
Abbiamo la conferma: il luogo è quello, il fotografo conferma la location su Unsplash, quindi non solo abbiamo trovato il luogo, ne abbiamo avuto la conferma, ma ci ha anche consigliato dove inquadrare, da quale posizione fotografare… insomma: buon lavoro no?
Studio della luce/tecnica fotografica
Ultima prova di questa sperimentazione, lo sappiamo che stiamo parlando con dei professionisti, quindi non avete certo bisogno di questo per “sapere come sono state realizzate” tecnicamente delle fotografie, ma a volte è utile chiedere una analisi e delle valutazioni, e quindi ecco un esempio:
Foto di Karsten Winegeart su Unsplash
Abbiamo chiesto quindi di farci una analisi tecnica di questa immagine ed ecco anche in questo caso l’analisi:
un rettangolo di luce, netto come il fotogramma di un proiettore 35 mm, si stende sul pavimento dello studio e risale il fondale a limbo, tagliando il vuoto ambra che lo circonda. l’uomo in tuta blu, collocato nell’angolo inferiore sinistro di quel fazzoletto luminoso, diventa il solo referente cromatico in un campo volutamente spoglio; tutto il resto è atmosfera, dominata dalla tinta calda ottenuta con gel CTO su lampade di riempimento o, più probabilmente, in color grading.
l’incisione millimetrica dei bordi dice che non siamo davanti a un softbox ma a un proiettore ellissoidale munito di ottica “spotlight” (aputure o godox, tanto per citare le versioni LED più diffuse) con le quattro lame interne chiuse a formare un trapezio. in teatro e sul set lo stesso risultato si ottiene con un gobo sagomatore piazzato nel “gate” dell’apparecchio, il punto ottico che permette di mettere perfettamente a fuoco il contorno della proiezione . la lama di luce arriva dall’alto sinistra, circa 40° sopra il piano dell’obiettivo; l’angolo si ricava dall’ombra: lunga, affusolata, quasi parallela al fascio, segno che la fonte è posta a distanza maggiore rispetto alla figura e che il cono d’incidenza è inclinato verso il terreno.
la scenografia minima – fondale continuo, nessun elemento d’arredo – suggerisce uno spazio controllato, forse il classico studio “cove” da still-life in cui il cicloro torna a curva a 2 m dal suolo. lo spot, distante otto-dieci metri dal soggetto, deve essere settato a un’apertura ristretta (f/16 equivalente nella scala del proiettore) per mantenere tagliente il bordo; sul corpo della lampada, le alette di sagomazione chiudono il fascio reducendo la dispersione laterale. al di fuori del rettangolo, una coppia di flood con gel ambra, abbassati di due stop, pittura il vuoto: il contrasto cromatico nasce dal bilanciamento del bianco della camera, tarato sul neutro del rettangolo e quindi spostato verso il caldo nello spazio circostante.
l’inquadratura proviene da una scala o da un braccio: il punto di vista è circa tre metri sopra la testa del soggetto, con un’ottica grandangolare moderata (28-35 mm su full frame) che lascia respirare il negativo space senza introdurre distorsioni prospettiche. il diaframma reale, intorno a f/4, mantiene nitida sia la punta delle sneakers sia la curva sul fondale; l’otturatore vicino a 1/250 s congela l’eventuale micro-movimento del modello, mentre gli iso restano bassi per preservare la pulizia tonale del monocromo caldo.
sul piano narrativo, la fotografia gioca tutto sull’antitesi luce-ombra: la figura umana si iscrive in un campo geometrico che ricorda i test di proiezione hollywoodiani degli anni quaranta, ma la palette – blu elettrico contro terracotta – la trasporta in un registro contemporaneo. il riferimento tecnico è la “slash lighting” studiata da molti ritrattisti commerciali, riproposta qui con una cura quasi cinematografica: sagomatore per il taglio, riempimenti soft appena accennati, color grade che esalta la saturazione del costume. wired, recensendo i primi kit di gobos per speedlight, notava come la precisione del contorno sia l’essenza di questo tipo di set-up; lo scatto in esame porta quel principio alle sue estreme conseguenze, facendo del perimetro di luce il vero campo d’azione visiva .
in definitiva, ciò che vediamo è uno studio sulla forma della luce più che sul soggetto: un esperimento di geometria ottica in cui la tecnologia del proiettore ellissoidale, combinata a una regia cromatica calibrata al decimo di passo, trasforma un semplice ritratto ambientato in un esercizio di minimalismo teatrale.
Di sicuro, un sacco di cose in questo caso se le è inventate (anche se sono credibili), ma alcune sono interessanti, sono stimolanti per iniziare a capire “cosa si vede, cosa si più vedere) da una immagine, e forse un po’ in tutti noi, in tutti voi, una luce per capire quanto l’AI può essere integrata nel nostro lavoro, come un consulente, un compagno di viaggio, un supporto per strategie e per far crescere la visione. La visione globale.
Se trovate interessanti queste piccole sperimentazioni, fateci sapere: ve ne possiamo proporre molte altre.