3 feb 2014

Verso il PDA: archivi pubblici e dati scientifici

La buona scienza ha bisogno di risultati trasparenti e riproducibili, spesso disponibili grazie ai finanziamenti pubblici. Per questo motivo, un numero sempre crescente di editori, agenzie per la raccolta fondi e scienziati chiede che l'archiviazione di dati pubblici avvenga in database open-access (accessibili a tutti).
I benefici per la comunità scientifica del cosiddetto "Public Data Archiving" (PDA) sono acclarati, ma la decisione di mettere a disposizione i dati scientifici spetta ai singoli ricercatori, che sono per lo più restii alla condivisione pubblica del frutto del loro lavoro, soprattutto a causa dei costi individuali che esso comporta.

Ciò probabilmente spiega perché il PDA è ancora poco diffuso in discipline come la biologia evoluzionistica e l'ecologia, che comprendono set di dati difficilmente comprensibili a un comune mortale (e che quindi necessitano di una elaborazione da parte di terzi).

Dominique G. Roche, ricercatore dell'Australian National University di Canberra specializzato negli studi sulla barriera corallina, ha avanzato insieme ad altri colleghi quattro proposte per favorire la partecipazione agli archivi di dati pubblici. Dimostrando, fra l'altro, che attraverso tali azioni i benefici del PDA ne supererebbero di gran lunga i costi.


A suo parere, saranno sicuramente necessari un abbassamento dei costi e/o un aumento dei benefici per coloro che detengono le informazioni primarie. Quelli pubblicati su PLOS Biology sono, in fondo, piccoli e semplici cambiamenti, che potranno però migliorare gli strumenti per archiviare correttamente e mettere a disposizione del pubblico i dati scientifici.

Ecco, nel concreto, i quattro suggerimenti:

1) Rendere più flessibili le restrizioni sugli archivi di dati.

La durata delle restrizioni sui dati è un fattore determinante. Gli autori che optano per periodi più lunghi possono però rilasciare metadati, incoraggiando così coloro che sono interessati a contattarli direttamente per richiedere l'accesso a tutto il dataset. Naturalmente, gli open data sono sempre preferibili, ma - se adeguatamente archiviati e ricercabili temporaneamente - i dati sotto "embargo" sono sicuramente migliori di quelli inaccessibili. 

2) Incoraggiare la comunicazione tra generatori e utilizzatori di dati


È indispensabile incoraggiare una cultura della comunicazione e di etichette condivise tra tutti gli stakeholder. Sia per evitare la duplicazione degli sforzi tra chi genera e archivia i dati e chi li utilizza, sia per ridurre al minimo il rischio di interpretazioni alternative da parte di ricercatori con diversi livelli di conoscenza in materia. Il dialogo porta con sé anche il vantaggio di favorire ulteriori collaborazioni, con benefici per tutte le parti in gioco.

3) Divulgare principi etici sul ri-utilizzo dei dati.

Per promuovere il Public Data Archiving servono misure che riducano i conflitti di interessi sin dalla condivisione dei dati. Ad esempio, chi pubblica i dati potrebbe richiedere a chi li utilizza una dichiarazione di impegno etico: un breve riassunto degli sforzi fatti per contattare l'autore della ricerca, la riposta, e ogni discussione su collaborazioni, interpretazioni, risultati. Procedure simili potrebbero essere applicate anche nelle candidature per ottenere finanziamenti pubblici.

4) Favorire il riconoscimento ufficiale dei dati archiviati pubblicamente.  

I dataset archiviati vengono solitamente rilasciati sotto licenza Creative Commons Zero, che non obbliga legalmente di citare la fonte dei dati che vengono utilizzati. Un adeguato riconoscimento del PDA si poggia su buone pratiche scientifiche, per cui la citazione è uno dei migliori modi di incoraggiare la partecipazione al PDA. Possono farlo i giornali, gli enti pubblici, le università, premiando gli sforzi di chi fa ricerca e spingendoli a favorire il bene dell'intera società.



In conclusione, il ricorso al Public Data Archiving e la condivisione di grandi quantità di dati avrebbe molti benefici, ma genera anche tensioni. Secondo gli autori del paper, la soluzione implica il riconoscimento di una distinzione fondamentale: quella tra gli interessi individuali dei ricercatori e gli interessi della comunità scientifica.

Magari non tutti condividono questa visione. La speranza è, però, che si faccia qualcosa per migliorare la comunicazione scientifica attraverso un uso più aperto dei dati.

Nessun commento :

Posta un commento