Da ormai diversi mesi la stampa ci tiene informati sulla crisi di Twitter. A differenza di Facebook, il social network dei 140 caratteri non cresce abbastanza nel numero dei suoi utenti, non genera sufficienti profitti e il suo titolo in borsa è in caduta libera. A prescindere da una lunga serie di considerazioni di carattere economico e strategico che potrebbero essere fatte, appare evidente che c’è una differenza sostanziale che separa Twitter dal colosso di Zucherberg: il primo è stato fondato e sviluppato sulla possibilità di condividere brevi contenuti di testo, il secondo ha fatto della condivisione dell’immagine il motore dell’attività dei propri utenti.
Con la trasformazione, all’inizio anche mal digerita, del profilo in un diario per immagini, Facebook ha colto ed orientato quella che a tutti gli effetti si può considerare una trasformazione epocale prodotta dalle tecnologie digitali: l’immagine ha preso il sopravvento sulla parola. Il web 2.0 si è costruito intorno alla condivisione di immagini, ovvero intorno a quella “lingua dell’audiovisivo” (di cui discute Arcagni nel suo ultimo libro) divenuta in pochissimo tempo universale. E non è forse un caso che negli ultimi tempi Twitter abbia cercato di orientare in questa direzione i propri utenti con Periscope, Vine e, non da ultimo, con l’introduzione delle emoticon.
Lev Manovich è stato il primo, attraverso il concetto di esperanto visivo, a teorizzare, nell’ambito degli studi sui nuovi media, l’idea di un linguaggio universale fatto di immagini. L’esperanto visivo nella teoria di Manovich identificava la lingua delle interfacce, ovvero di quei programmi che traducono il codice binario dei media digitali in un’esperienza simile a quella analogica. Per mandare un’email o organizzare i documenti dell’archivio di un hard disk, scrive Manovich, utilizziamo interfacce grafiche, cioè delle immagini.
Eppure è stata la diffusione del web 2.0 ad aver dato concretezza a quell’aspirazione del cinema – pensiamo a Kinoglaz di Vertov – di una lingua per immagini parlata potenzialmente da tutti. Se infatti per lungo tempo gli spettatori delle proiezioni cinematografiche hanno potuto comprendere quella lingua, ma non parlarla, con la diffusione delle tecnologie digitali, ed in particolar modo con la diffusione delle piattaforme dedicate ai cosiddetti user generated content, gli spettatori si trasformano in utenti, ovvero in produttori, manipolatori e montatori di immagini. Usiamo le immagini (delle interfacce) per lavorare sulle immagini della nostra vita, privata, pubblica e collettiva.
La University College di Londra ha recentemente pubblicato i primi risultati di un progetto molto ambizioso, Why we post, un’analisi antropologica sugli usi e le conseguenze dei social media, realizzata a partire da una ricerca sul campo condotta in diversi luoghi del globo. Tra le varie “scoperte” (in tutto 12 per il momento), c’è anche quella sull’esperanto visivo. Scrivono i ricercatori: «We used just to talk, now we talk photos. I social media stanno spostando la comunicazione umana dall’uso della parola scritta e della voce all’uso di immagini visive». Questa scoperta apre il campo ad importanti quesiti, forse di carattere più filosofico che antropologico: quali sono le condizioni di possibilità di questa lingua delle immagini? quali le sue forme e quali le regole della sua grammatica?
Ciò che ha reso possibile l’idea di un esperanto visivo è il fatto che con la cultura partecipativa della rete noi assistiamo ad una radicale forma di esternalizzazione della nostra immaginazione. Seguendo le riflessioni proposte da Pietro Montani nel suo ultimo libro, Tecnologie della sensibilità, possiamo distinguere tre funzioni dell’immaginazione: quella produttiva (che consiste nel «conservare e richiamare quanto si è conservato»), quella riproduttiva («ricombinare, progettare, configurare») e quella interattiva (che consiste nel modificare «l’ambiente facendosi guidare da ciò che vi si trova o da ciò che vi si scorge e vi si proietta»).
Ora, è facile constatare che la nostra immaginazione riproduttiva viene oggi sempre più massicciamente esternalizzata ( e quindi aumentata) nelle tecnologie per la riproduzione delle immagini. Lo sviluppo congiunto delle tecnologie mobile e di quelle per la riproduzione dell’immagine ha determinato una situazione paradossale, per cui il presente, nell’atto stesso in cui accade, diviene immediatamente, materiale registrato, un record, un’immagine-documento attraverso cui si attiva la comunicazione partecipata degli utenti.
Nella funzione Memories di Facebook si concretizza, sicuramente nella sua versione più triviale e proceduralizzata, questa forma di esternalizzazione. Il caso di Facebook ci permette, però, anche di fare una precisazione: la peculiarità del nostro tempo, e dell’attuale forma di esternalizzazione dell’immaginazione produttiva, non consiste nella possibilità tout court di produrre, più facilmente che in passato, delle immagini, ma nella possibilità di condividerle. Condividere oggi significa archiviare, ovvero «conservare e richiamare».
Ma nella cultura partecipativa della rete trova la propria esternalizzazione anche la nostra immaginazione produttiva. Una volta condivisa, infatti, l’immagine è pronta per essere riappropriata e diventare oggetto della manipolazione collettiva degli utenti, grazie all’utilizzo di software sempre più user-friendly.
Nella rete noi condividiamo non soltanto l’immagine, ma il suo processo di «ricombinazione, progettazione e configurazione», che diviene così pubblico ed esposto. Su tale processo produttivo, pubblico ed esposto, si fonda la comunità stessa della rete e da esso, infatti, derivano le forme e i registri dell’esperanto visivo: dai meme ai mashup, dalle gif alle emoticon. Prendiamo il caso di meme e gif: si tratta per lo più di immagini di repertorio, di immagini d’archivio, che vengono trasformate dagli utenti e poi condivise, rese cioè disponibili ad essere nuovamente modificate.
La regola principale di questo processo produttivo – quella che potremmo definire la regola aurea della grammatica dell’esperanto visivo – è l’intermedialità, ovvero la giustapposizione di diverse forme e registri mediali, quali possono essere il testo, la musica il fumetto, l’immagine cinematografica, quella televisiva e così via. L’intermedialità genera un effetto détournement: la decontestualizzazione dell’immagine, la sua collocazione in un contesto diverso da quello originario e la giustapposizione di diversi registri mediali attivano un effetto molto spesso ironico e divertente, che è alla base della capacità di diffusione dell’immagine stessa.
Ed è proprio in questo aspetto ludico che si concentra il potenziale, tutto ancora inespresso, della lingua della rete. Parlare l’esperanto visivo significa innanzitutto giocare con le immagini, inteso, però, in una duplice accezione. Da un lato, infatti, giocare con le immagini vuol dire che esse diventano occasione di intrattenimento, poco più di un divertissement che si consuma nella condivisione compulsiva, nella intensità del virale. Dall’altro giocare con le immagini significa anche sottoporle ad un continuo lavoro creativo e libero che non ha altra finalità se non quella di trovare nuove regole.
Ciò che intendo suggerire, allora, è che gli sforzi della nostra immaginazione interattiva («modificare l’ambiente facendosi guidare da ciò che vi si trova») devono essere indirizzati proprio verso la ricerca di nuove regole per l’esperanto visivo: nel futuro le regole e le modalità della nostra comunicazione, e quindi la condizione stessa di possibilità di una comunità, dipenderanno sempre più da esso.