Filiera dell’open e beni comuni digitali: la rivoluzione culturale passa di qui
29 Novembre 2018
Un viaggio dietro le quinte di Wikipedia
19 Dicembre 2018
Show all

Citazioni aperte (e dove trovarle)

In vista del convegno “Sfide e alleanze tra Biblioteche e Wikipedia”, che si terrà venerdì 7 dicembre alla Biblioteca Nazionale Centrale di Firenze, abbiamo intervistato alcuni dei relatori e soci Wikimedia Italia che interverranno nell’ambito dell’iniziativa.
Luca Martinelli, amministratore di Wikidata e socio Wikimedia Italia, e Silvio Peroni, ricercatore presso il Dipartimento di Filologia Classica e Italianistica dell’Università di Bologna, ci hanno anticipato in una “intervista doppia” alcuni dei temi che tratteranno nell’ambito del loro intervento all’interno del panel “Wikidata e i dati bibliografici”, che si svolgerà dalle 14:00 alle 17:00.

Perché (e per chi) è importante disporre di citazioni aperte e che cosa sono, spiegato nel modo più semplice possibile?

Silvio: In ambito scientifico, una citazione bibliografica è il collegamento concettuale che intercorre tra due opere (paper di ricerca o altro), che si manifesta tipicamente con l’inclusione di un riferimento bibliografico in nota, intertestuale o in bibliografia. In generale, le citazioni vengono utilizzate dagli autori per sostenere o confutare teorie o studi realizzati da altri ricercatori, dipartimenti o istituti in un determinato dominio scientifico, contribuendo così all’avanzamento della conoscenza in quel dato ambito.
I dati che permettono di descrivere queste citazioni – non i contenuti, bensì i metadati dell’entità citante e di quella citata più una rappresentazione del relativo collegamento concettuale – sono aperti quando (a) è possibile recuperarli da qualche parte in un qualche formato strutturato e facilmente processabile da software, e (b) vengono rilasciati in con licenze estremamente permissive, come, ad esempio, la CC0.
Visto che non riguardano i contenuti bensì i collegamenti tra gli articoli, questi metadati non sono tutti aperti per natura? Ebbene no.
Da anni vari servizi, come ad esempio Scopus of Web of Science, collezionano e curano queste citazioni in opportuni indici, vendendole a peso d’oro. Facendo una piccola metafora, è come se una certa organizzazione controllasse tutti i ponti di Venezia, e facesse pagare un pedaggio a chiunque voglia attraversarne uno per muoversi in un’isola diversa della città. Questi ponti sono le nostre citazioni.
Il movimento per le citazioni aperte, coadiuvato nell’ultimo periodo dall’Initiative for Open Citations (I4OC, https://i4oc.org), vuole cercare di spezzare questo “pedaggio” obbligatorio rendendo disponibile a tutti questo enorme grafo di conoscenza scientifica.

Luca: Il tema delle citazioni è importantissimo per il movimento Wikimedia, perché Wikipedia e i progetti correlati hanno bisogno di fonti affidabili su cui basare i propri contenuti. Oltre alla difficoltà di accedere alle fonti, che spesso non sono digitalizzate o protette da paywall, spesso risulta complicato anche riutilizzarle nelle differenti versioni linguistiche di Wikipedia.
L’idea quindi è trovare un modo comune per catalogare le fonti su Wikidata, chiedendo aiuto anche alla comunità bibliotecaria. Questo è un lavoro titanico, perché presenta tantissimi aspetti problematici, tra cui quelli già enunciati da Silvio.
Ma non solo. Un aspetto poco considerato, che è diretta conseguenza del sistema attuale, è che le pubblicazioni in inglese sono prevalentemente “premiate” e più utilizzate, rispetto a quelle prodotte in qualsiasi altra lingua. Questo è un problema gigantesco, specie per tutte quelle aree scientifiche e per quei Paesi che non adottano o hanno difficoltà ad adottare questa lingua e che finiscono, per questo motivo, ai margini della comunità scientifica, a prescindere dalla qualità del lavoro.

Favorire la circolazione delle informazioni e l’accesso alla conoscenza: sembra semplice ma a quanto pare non lo è per nulla, specialmente in ambito accademico. Quali sono i principali ostacoli che riscontrate?

Silvio: Dipende molto dal contesto. Tuttavia, dal mio punto di vista, il principale ostacolo, almeno in Italia, è derivato dalla mancanza di “remunerazione accademica” effettiva soprattutto quando ricercatori spingono, promuovono e pubblicano in maniera aperta (spesso usando fondi propri) i loro risultati di ricerca.
Sebbene l’accesso ai risultati della ricerca scientifica, soprattutto se pagati con finanziamenti pubblici, dovrebbe essere garantito a tutti e libero da vincoli, lo scenario imposto dagli editori (e supportato dalle istituzioni) nell’ultimo periodo è andato più verso il mero profitto economico piuttosto che la libera fruibilità accademica.
Il discorso è molto complesso e sfaccettato, ed è complicato farne un sunto efficace e completo in poche righe. Tuttavia, dal mio punto di vista, una delle colpe principali ricade su quegli enti di valutazione, spesso nazionali, che di fatto impongono trasversalmente ai ricercatori di pubblicare su determinate tipologie di riviste (solitamente non aperte) che spesso sono controllate dalle stesse organizzazioni che forniscono i dati per valutare l’impatto del lavoro di ogni singolo ricercatore. In pratica, è un processo che alimenta se stesso, senza fornire alternative aperte efficaci.
La “rivoluzione” (se così possiamo chiamarla) dovrebbe arrivare dagli stessi enti di valutazione nazionali, spesso governativi, che dovrebbero forzare la mano per riuscire a cambiare le dinamiche di pubblicazione e, conseguentemente, valutazione scientifica e fruizione accademica. Facile a dirsi, ovviamente – ma, in generale, il processo di cambiamento è molto più complicato di quel che possa sembrare.

Luca: Dal punto di vista wikipediano, uno dei principali problemi è l’assenza di una versione web delle pubblicazioni o dei libri che sia davvero consultabile. Parlo sia di libri scansionati in pubblico dominio, spesso soggetti a limitazioni che non hanno granché motivo di esistere e che vengono tuttavia imposte dal padrone della piattaforma, sia di pubblicazioni sotto copyright, di cui viene reso accessibile soltanto uno snippet o un abstract.
Le motivazioni di tali assenze le ha già spiegate molto bene Silvio. Io mi permetto di aggiungere che, senza guardare agli sprechi e ai conflitti di interesse del sistema attuale, queste risorse potrebbero essere utilizzate per condurre altri studi e migliorare la ricerca, la fruibilità e la diffusione delle pubblicazioni, magari lavorando proprio su una migliore annotazione delle citazioni.

Luca, sei appena tornato da Berkeley dove hai partecipato a WikiCite 2018. Hai visto il futuro e ce lo puoi descrivere?

Direi che si tratta di un futuro molto interessante! Quest’anno abbiamo dedicato un’intera giornata della conferenza a capire “cosa vogliamo fare da grandi insieme”, dove “insieme” è la vera parola chiave. Abbiamo parlato di tre differenti scenari per questo progetto, che andavano dal creare un “semplice” database di tutte le fonti citate nei progetti Wikimedia, alla creazione di raccolte tematiche di pubblicazioni bibliografiche, al vero e proprio “sogno bibliografico”, ossia un progetto che possa fungere da “hub” di tutte le pubblicazioni esistenti al mondo e che possa servire i progetti Wikimedia, i servizi bibliotecari mondiali…e i loro utenti. Probabilmente, nei prossimi anni a venire procederemo passo passo a consolidare i primi due scenari, per poi lanciarci a realizzare il nostro vero sogno. La strada è tracciata, adesso tocca solo percorrerla.

E in Italia, Silvio, quali sono le buone pratiche o le esperienze innovative che riscontri in ambito accademico?

Da quel che vedo e dall’esperienza che ho nella mia Università, in Italia il mondo accademico è abbastanza disinteressato all’argomento. Di fatto, il processo di aprire i risultati di una ricerca viene per lo più visto come del lavoro in più da fare, e pure oneroso in termini di risorse (tempo e denaro). Non fraintendermi: non sto dicendo che non ci siano persone che si dedicano alla divulgazione e pubblicazione aperta dei loro risultati. Quel che sto dicendo è che, da quel che vedo, sono eccezioni piuttosto isolate, e non formalmente e strutturalmente supportate efficacemente, per esempio con eventi di divulgazione e fondi specifici, dalle istituzioni dove queste persone lavorano.
Sensibilizzare la platea a questi temi è uno degli aspetti cruciali, secondo me, ed eventi come “Sfide e alleanze tra Biblioteche e Wikipedia” o il Workshop on Open CItations che si è tenuto a Bologna tra il 3 e il 5 settembre sono un primo passo per creare coscienza sul tema, soprattutto da parte delle istituzioni.
Poi, bisogna ammettere che sul tema delle citazioni aperte qualcosa si sta muovendo. Ad esempio, sto notando che piccole riviste che non hanno i fondi necessari per iscriversi e mandare i dati citazionali aperti a infrastrutture ad hoc come Crossref, iniziano ad utilizzare Wikidata – il che è grandioso.
Contemporaneamente, altre infrastrutture come OpenCitations, di cui sono Direttore, cercano sempre più di implementare meccanismi automatici per raccogliere grandi masse di dati citazionali provenienti da risultati di specifici progetti europei ed extra-europei, così da aumentare la mole delle citazioni aperte disponibili.

Potete fare un appello per convincere ricercatori e studiosi a rendere disponibili i propri lavori in open access. Come li convincete?

Luca: Rendere disponibili i propri lavori è un vantaggio, sempre. Cito esplicitamente i risultati di un paper del 2017, “Science Is Shaped by Wikipedia”, dove si vede che integrando le voci di Wikipedia con i risultati delle più recenti pubblicazioni scientifiche si ottengono due risultati importantissimi: si rende quanto già studiato “general knowledge”, ossia la si divulga al “grande pubblico”, e si orienta la ricerca verso quegli aspetti di un determinato argomento che invece risultano ancora oggi oscuri. Un risultato efficace ed efficiente, ottenuto a costo sostanzialmente zero.

Silvio: Faccio il pragmatico: pensando alla dinamica valutativa prettamente italiana, e quindi considerando le citazioni come una “moneta” che pesa il proprio contributo accademico, ci sono evidenze chiarissime, supportate e difese in diverse pubblicazioni accademiche, che mostrano come la diffusione aperta e anticipata sulla pubblicazione ufficiale (attraverso i pre-print) di un certo lavoro si riassuma nell’accumulare più citazioni rispetto ai lavori “chiusi”. Quindi, considerando questo: perché non farlo? – dal momento che esistono anche strade ibride (e.g. green open access) che possono essere sfruttate senza pagare alcunché?

Nell’immagine: Foto di gruppo a WikiCite 2018. Di Satdeep Gill, CC BY-SA 4.0, via Wikimedia Commons