Strolling Cities, al Padiglione Italia alla Biennale, è un viaggio nelle città italiane reinterpretate dall’Intelligenza Artificiale nutrita da poesie e voci umane. Perché, spiega l'autore Mauro Martino, “la creatività si evolve grazie alla co-creazione tra persone e modelli generativi”

Prima di parlare del media artist Mauro Martino è bene guardare il suo lavoro, che trovate qui.

Se, dopo averlo fatto, vi sentite in uno strano mondo, a metà tra lo straniamento e la familiarità, allora vuol dire che avete colto il punto. Allora vale la pena che continuiate a leggere.

Strolling Cities, al Padiglione Italia alla Biennale di Venezia, è l’ultima fatica di Martino, realizzata con Ingrid Paoletti, docente al Politecnico di Milano. Sono video installazioni realizzate “dando in pasto” all’Intelligenza Artificiale non dati nel senso tradizionale del termine ma poesie e prose poetiche dedicate alle città. Stringhe di nomi, aggettivi, atmosfere fatte da lettere proposte attraverso lo strumento umano della voce che la macchina ha “digerito” e usato come input per immaginare paesaggi urbani. L’AI, insomma, ha lavorato in modo creativo elaborando materiali video preesistenti e usando l’ordine impostole dall’artista come canovaccio.

Fondatore del Visual Artificial Lab di IBM a Cambridge e Research Manager al MIT-IBM Watson AI Lab, Mauro Martino progetta il punto di incontro tra le infinite possibilità delle nuove tecnologie e dell’approccio umanistico. Strolling Cities è il primo progetto che unisce A.I. generativa, voce umana, poesia e paesaggio urbano.

Quando si parla di AI è bene partire dalla base. Su cosa lavori esattamente?

I più recenti sviluppi nel campo delle reti neurali artificiali hanno introdotto una nuova estetica nell'arte e nel design. Abbiamo scoperto lo spazio latente. Un luogo a cui, se non indirettamente, non possiamo accedere e che non possiamo controllare. Il mio lavoro è navigare in questo spazio immenso e comprendere le forme e l'estetica che si generano tra gli strati nascosti delle reti neurali profonde. Per me la bellezza è da ricercare in queste architetture, utilizzando diverse raccolte di dati per addestrare le macchine. La creatività umana si evolve grazie a nuove forme di co-creazione tra persone e modelli generativi.

Portaci nel tuo centro di ricerca.

Sono parte di un team di 200 persone e ci occupiamo di core AI, la ricerca di base dell’Intelligenza Artificiale. Una delle aree di studio riguarda come l’AI influisca e generi esperienze estetiche. Spesso si paragona l’AI alle innovazioni tecniche come la macchina fotografica o la cinepresa, ma non è esattamente così. AI non è un oggetto da studiare o migliorare, ma un’area di studio che cambia continuamente. Per questo avere intorno un team, macchinari avanzati e un approccio scientifico è indispensabile per essere all’avanguardia. Per ritrasmettere le innovazioni, devi essere in un flusso di ricerca continua.

Veniamo a Strolling Cities, quali sono le caratteristiche peculiari?

La premessa è che con l’AI si possono fare molte cose, ma avrai vera autorialità solo se hai il controllo della raccolta dei dati. Per Strolling Cities, abbiamo seguito tutte e tre le fasi: il decidere cosa e come raccogliere i dati, la costruzione del modello e l’esperienza utente.

Se per raccontare le città ci fossimo accontentati di saccheggiare internet avremmo ottenuto visioni parziali e focalizzate sul turismo di massa. Abbiamo avuto la fortuna di poter avere macchinari potenti, la collaborazione del Politecnico di Milano e dei suoi studenti e studentesse. Questa è la prima particolarità: aver effettuato tutti i rilievi fotografici con macchinari collegati dal software MindEarth e un gps programmato per non fare overlap di immagini. La scelta del “cosa” è raramente affrontata nell’arte AI, ma è ciò su cui si fonda la poetica: scegliere cosa raccontare.

Volevamo cercare l’atmosfera delle città anche se i landmark più noti non sono protagonisti: c’è Roma anche se non c’è Piazza di Spagna. Questo perché la foto del Colosseo o di San Marco è importante tanto quanto la foto del bar dall’altro lato della strada. Una sorta di democrazia per tirar fuori i pattern più ricorrenti, la luce e la prospettiva. Altra possibilità data dalla curatela dei dati è la scelta della prospettiva di ripresa, studiata per dare la sensazione che sia la città ad avanzare intorno a te. Questo effetto non si è mai visto: è stato progettato e programmato.

Insomma, avete creato una drammaturgia di dati. Ma come è entrata in campo la poesia?

Esatto, e alle scelte estetiche abbiamo poi unito la parola e creato la tecnologia Voice-to-City: che permette di interagire con la macchina attraverso la voce. Per sfidare la tecnologia abbiamo scelto di usare quanto di più metaforico ed etereo avevamo a disposizione: la poesia. Dalila Colucci, ricercatrice di poesia visuale ad Harvard ci ha accompagnati nella selezione. Fin dai primi test abbiamo capito di aver creato qualcosa di più di un artefatto tecnologico: era possibile far fruire una nuova esperienza di poesia visuale realizzata insieme all’Artificial Intelligence.

Ovviamente il fascino di vedere una parola diventare visiva è molto forte ma ciò che rende unico Strolling Cities è che la macchina ti segue, aggancia ciò di cui è stata nutrita – immagini di città – alle parole che sente. Codifica un linguaggio legato al landscape e genera immagini on the fly, ha imparato come si fanno le città e le inventa insieme alla voce dell’utente. Queste sono le città che non esistono, non ce ne saranno mai due uguali.

Si può fare un test interattivo?

Il link che ti ho dato (quello che abbiamo messo in apertura, ndr) è una demo dove manipolare i landscape urbani attraverso le parole.

Ci fai fare un passo avanti verso il prossimo algoritmo?

Abbiamo dialogato con una AI generativa ed è la prima volta che accade. È già un avvicinarsi a una visione fantascientifica. Ovviamente la precisione con cui il modello generativo ti segue nei contenuti o nell’implementare l’interazione della macchina con i risultati già computati sono sfide ancora aperte. E poi si apre lo scenario della body gesture da integrare. Il futuro è creare cinema, advertising, poesia visuale, interior design attraverso la voce. Parlare per vedere, disimpegnare dallo schizzo e incantare gli utenti, e darsi la possibilità di vivere un’esperienza interattiva e con un livello di imprevedibilità – e di sorpresa – molto divertente.