La preservazione dei dati di ricerca e le agenzie di finanziamento della RS

Versió per a imprimirVersió per a imprimir
Alice Keefer
Facultat de Biblioteconomia i Documentació
Universitat de Barcelona
 

Maron, Nancy L.; Loy, Matthew (2011). Funding for sustainability: how funders' practices influence the future of digital resources. (http://www.ithaka.org/ithaka-s-r/research/funding-for-sustainability/FundingForSustainability.pdf)

Questa relazione, incaricata dal JISC e dalla Strategic Content Alliance e preparata da Ithaka S&R, analiza cosa fanno e cosa possono fare le agenzie di finanziamento per la ricerca, per far sì che i materiali digitali, raccolti o generati durante i progetti di ricerca, soprattutto i dati scientifici ma anche altre risorse complesse, possano continuare ad essere accessibili ed utilizzabili in futuro.
 Negli ultimi anni si è visto crescere il numero di iniziative, su scala internazionale, dedicate alla gestione sul lungo periodo dell"informazione scientifica". Questo concetto, nonostante abbia una portata molto ampia, oggi si riferisce principalmente ai dati scientifici generati o raccolti nel corso di progetti di ricerca, e non tanto quindi alle pubblicazioni che si generano dalla ricerca stessa. Una recente consultazione, della Commissione Europea sull'informazione scientifica nell'epoca digitale, definisce i dati di ricerca con la seguente forma:
 

"‘Research data' … may be numerical/quantitative, descriptive/qualitative or visual, raw or analysed, experimental or observational. Examples are digitised primary research data, photographs and images, films, etc."

La terminologia che si suole utilizzare attualmente per la gestione attiva e prolungata dei dati scientifici è "digital curation" o "data curation", definito dal Digital Curation Centre come "gestire, preservare e aggiungere valore ai dati di ricerca nel corso del loro ciclo di vita" (www.dcc.ac.uk/digital-curation/what-digital-curation)

A differenza dei documenti che si publicano per diffondere i risultati di ricerca (e-prints, articoli, comunicazioni a congressi, ecc.), i dati di ricerca digitali tradizionalmente non arrivavano oltre il gruppo responsabile della loro creazione e generalmente disponibili soltanto per la durata della ricerca. Attualmente la sostenibilità di questi dati interessa alle università, alle agenzie di finanziamento della ricerca, ai governi ed anche alla Commissione Europea . La ragione è fondata sull'importanza riconosciuta ai dati per lo stimolo dell'innovazione scientifica e tecnologica da un lato, e dall'altro il risparmio futuro che rappresenta il poter approfittare di dati già esistenti in progetti di ricerca: ossia, si potranno "ri-utilizzare" (reuse). Tuttavia, così come afferma la coordinatrice della coalizione olandese di preservazione digitale, si trata del "tipo di informazione digitale più complicato da gestire (curate), visto che tanto i produttori che generano i dati, quanto i tipi di dati, sono molto variabili e s'includono oggetti molto complessi…".1

Gli autori della relazione hanno realizzato inchieste in 25 agenzie di finanziamento pubblico o senza animo di lucro, in Europa ed in nord America, per conoscere, fra i vari fattori, le strategie utilizzate per obbligare o incentivare i ricercatori a mantenere accessibili, dopo il progetto, i dati digitali creati con il loro finanziamento. Si portano come esempi i seguenti tipi di risorse: grandi databases con contenuto generato dagli utenti, iniziative in reti sociali che dipendono dalla crescita e manutenzione del contenuto apportato dai partecipanti, e risorse educative on-line che si basano sulla generazione continua di materiali docenti di professori e d'altri.
Sebbene gli autori abbiano la propia definizione di "sostenibilità" (… la capacità di generare o di ottenere le risorse necessarie – finanziarie, ecc. – per proteggere ed aumentare il valore del contenuto o del servizio digitale destinati ai propri utenti), hanno rilevato tra le agenzie analizzate, la mancanza di normalizzazione e di coerenza nella maniera in cui si spiega questo concetto e se ne' comprova il funzionamento.
Nonostante queste mancanze, esiste uniformità nel riconoscimento sui requisiti tecnici quali elemento base relativo alla sostenibilità dei prodotti digitali. Per tanto, i formulari di richieste di finanziamento spesso inglobano (built-in) anche i fattori relativi alla sostenibilità tecnica, come il formato di dati; il sever dove risiederanno; la possibilità di migrazione del materiale a piattaforme e formati futuri e le necessità d'aggiornamento dei programmi e delle macchine per l'adeguamento alle nuove specifiche durante il progetto e anche dopo la sua chiusura.
Per aiutare, sia le agenzie sia i richiedenti il finanziamento, a stimare le risorse economiche ed instituzionali necessarie a garantire il soddisfacimento degli obbiettivi di sostenibilità delle risorse digitali dopo la chiusira dei progetti, il rapporto offre la tabella seguente:
 

Framework for Post-Grant Sustainability Planning for Digital Resources

Le conclusioni di questa relazione sono molto generali e non offrono modelli concreti. Peraltro altre iniziative recenti offrono consigli pertinenti e pratici sui requisiti tecnici e che possono servire a creare le condizioni per la sostenibilitpa delle risorse digitali complesse e create con denaro destinato al benessere sociale. Per esempio, dal gennaio del 2011 la National Science Foundation, una delle principali agenzie di finanziamento della ricerca nordamericana, obliga ad allegare un "piano di gestione dei dati" insieme alle richieste di finanziamento. Di fatto molte biblioteche universitarie già offrono il servicio d'aiuto al ricercatore nel riempimento del nuovo formulario. (http://dataconservancy.org/)

Il rapporto non fornisce risposta alla domanda sul chi dovrebbe assumere la responsabilità della preservazione dei dati scientifici a lungo termine, però è evidente che se le agenzie che finanziano la ricerca si mettessero d'accordo sulla definizione della sostenibilità e cominciassero a obbligare alla pianificazione, nella gestionde dei dati, dall'approvazione dei progetti si darebbero un passo importante nella preservazione di questi dati per le furure generazioni di ricervatori.
 

Riferimenti
Si aggiunge di seguito una selezione d'entità ed iniziative correlate alla gestione e preservazione dei dati scientifici, per coloro che siano interessati a seguire l'evoluzione di questa tematica:

- Alliance for Permanent Access (http://www.alliancepermanentaccess.org/).

- Beagrie, Neil; Lavoie, Brian; Wollard, Matthew (2010). Keeping research data safe-2: final report. (http://www.jisc.ac.uk/media/documents/publications/reports/2010/keepingresearchdatasafe2.pdf).

- Case studies in sustainability (2011). (http://www.ithaka.org/ithaka-s-r/research/case-studies-in-sustainability-2011/case-studies-in-sustainability-2011/).

- Consultation of scientific information in the digital age (2011). (http://ec.europa.eu/research/consultations/scientific_information/questionnaire.pdf).

- Data centres: their use, value and impact (2011).
(http://www.rin.ac.uk/our-work/data-management-and-curation/benefits-research-data-centres).

- Data Seal of Approval (http://www.datasealofapproval.org/).

- Digital Curation Centre. (http://www.dcc.ac.uk/).

- Insight into issues of permanent access to the records of science in Europe (2010). (http://www.parse-insight.eu/downloads/PARSE-Insight_D3-6_InsightReport.pdf).

- Managing and sharing data: best practice for researchers (2011).
(http://www.data-archive.ac.uk/media/2894/managingsharing.pdf).

- Research Data: Unseen Opportunities (2010). (http://www.carl-abrc.ca/about/working_groups/pdf/data_mgt_toolkit.pdf).

 

Nota

1. Angevaare, Inge (2009). "Taking care of digital collections and data: ‘Curation' and organisational choices for research libraries", Liber Quarterly, v.19, no 1, p. 6-7.