La preservación de los datos de investigación y las agencias de financiación de la I+D

Versió per a imprimirVersió per a imprimir
Alice Keefer
Facultad de Biblioteconomía y Documentación
Universitat de Barcelona
 

Maron, Nancy L.; Loy, Matthew (2011). Funding for sustainability: How funders' practices influence the future of digital resources. (http://www.ithaka.org/ithaka-s-r/research/funding-for-sustainability/Fun...).

Este informe, encargado por el JISC y la Strategic Content Alliance y preparado para Itaca S&R, analiza qué hacen y qué pueden hacer las agencias de financiación de la investigación para conseguir que los materiales digitales recogidos o generados durante los proyectos de investigación -sobre todo los datos científicos y otros recursos complejos- sean accesibles y utilizables en el futuro.

En los últimos años ha crecido el número de iniciativas internacionales dedicadas a la gestión a largo plazo de la "información científica". A pesar de que este concepto tiene un alcance más bien amplio, ahora se enfocan principalmente los datos científicos generados o recogidos durante los proyectos de investigación y no tanto las publicaciones que resultan de la investigación. Una consulta reciente realizada por la Comisión Europea sobre la información científica en la época digital define los datos de investigación de la siguiente manera:

"'Research data' ... may be numerical/quantitative, descriptive/qualitative or visual, raw or analysed, experimental or observational. Examples are digitised primary research data, photographs and images, films, etc."

El término que se suele utilizar actualmente para la gestión activa y prolongada de los datos científicos es "digital curation" o "data curation", definido por Digital Curation Centre como "gestionar, preservar y añadir valor a los datos de investigación en el largo de su ciclo vital. " (http://www.dcc.ac.uk/digital-curation/what-digital-curation).

A diferencia de los documentos que se publican para difundir los resultados de la investigación -e-prints, artículos, comunicaciones a congresos, etc.- los datos de investigación digitales tradicionalmente no iban más allá del equipo responsable de su creación y generalmente sólo durante el período vigente de la investigación. Actualmente la sostenibilidad de estos datos interesa a las universidades, las agencias de financiación de la investigación, los gobiernos e, incluso, a la Comisión Europea. La razón se basa en la importancia reconocida de los datos para el fomento de la innovación científica y tecnológica, por un lado y, por otro, en el ahorro que representaría poder aprovechar los datos ya existentes en proyectos de investigación futuros: es decir, se podrán "re-utilizar" (reuse). Pero, tal y como afirma la coordinadora de la coalición holandesa de preservación digital, se trata del "tipo de información digital más complicado de gestionar (curate), ya que tanto los productores que generan los datos, como los tipos de datos, son muy variados y se incluyen objetos muy complejos... ".1

Los autores del informe reseñado realizaron encuestas a 25 agencias de financiación públicas o sin ánimo de lucro en Europa y Norteamérica para conocer, entre otros factores, las estrategias empleadas para obligar o incentivar a los investigadores a mantener accesibles después del proyecto los datos digitales creados con su financiación. Se ponen como ejemplos los siguientes tipos de recursos: bases de datos grandes con contenido aportado por los usuarios; iniciativas de redes sociales que dependen del crecimiento y mantenimiento del contenido añadido por los participantes, y recursos educativos en línea que se basan en la generación continua de materiales de aprendizaje por los profesores y por otros.

A pesar de que los autores tienen su propia definición de la "sostenibilidad" (... la capacidad de generar u obtener los recursos necesarios -financieros, etc.- para proteger y aumentar el valor del contenido o servicio digital para sus usuarios) detectaron entre las agencias analizadas una falta de normalización y de coherencia en la manera en que se explica este concepto y en el que se comprueba su cumplimiento.

A pesar de estas carencias, existe una uniformidad en el reconocimiento de los requerimientos técnicos como el primer elemento relacionado con la sostenibilidad de los productos digitales. Por tanto, los formularios de solicitud de financiación a menudo tienen incrustados (built-in) los factores relacionados con la sostenibilidad técnica, como el formato de los datos, el servidor donde se mantendrán, la posibilidad de migración del material a plataformas y formatos futuros, y las necesidades de actualizaciones de software y hardware para adecuarse a nuevos requerimientos a lo largo del proyecto y con posterioridad a su finalización.

Para ayudar tanto a las agencias como a los solicitantes de financiación a calcular los recursos económicos e institucionales necesarios para garantizar el cumplimiento de los objetivos de sostenibilidad de los recursos digitales tras la finalización de los proyectos, el informe ofrece el siguiente cuadro:
 

Framework for Post-Grant Sustainability Planning for Digital Resources

Las conclusiones de este informe son muy generales y no ofrecen pautas concretas. Ahora bien, otras iniciativas recientes presentan consejos pertinentes y prácticos sobre los requerimientos técnicos y, por tanto, pueden servir para facilitar la sostenibilidad de los recursos digitales complejos creados con dinero dedicados al beneficio común. Por ejemplo, a partir de enero de 2011, la National Science Foundation, una de las principales agencias de financiación de la investigación norteamericana, obliga a la inclusión de un "plan de gestión de datos" junto con las solicitudes. De hecho muchas bibliotecas universitarias ya ofrecen el servicio de ayudar al investigador a llenar este nuevo formulario. (http://dataconservancy.org/)

El informe no da respuesta a la cuestión de quién deberá asumir la responsabilidad de la preservación de los datos científicos a largo plazo, pero es evidente que si las agencias que financian la investigación se pusieran de acuerdo en la definición de la sostenibilidad y empezaran a obligar a la planificación de la gestión de los datos desde la aprobación de los proyectos, darían un paso importante para la preservación de estos datos para futuras generaciones de investigadores.

Referencias
Se incluyen a continuación una selección de entidades e iniciativas relacionadas con la gestión y preservación de los datos científicos para los interesados ​​en seguir la evolución de este tema:

- Alliance for Permanent Access (http://www.alliancepermanentaccess.org/)
- Beagrie, Neil; Lavoie, Brian; Wollard, Matthew (2010). Keeping research data safe-2: final report. (http://www.jisc.ac.uk/media/documents/publications/reports/2010/keepingr...).
- Case studies in sustainability (2011). (http://www.ithaka.org/ithaka-s-r/research/case-studies-in-sustainability...).
- Consultation of scientific information in the digital age (2011). (http://ec.europa.eu/research/consultations/scientific_information/questi...).
- Data centres: their use, value and impact (2011).
(http://www.rin.ac.uk/our-work/data-management-and-curation/benefits-rese...).
- Data Seal of Approval (http://www.datasealofapproval.org/).
- Digital Curation Centre. (http://www.dcc.ac.uk/).
- Insight into issues of permanent access to the records of science in Europe (2010). (http://www.parse-insight.eu/downloads/PARSE-Insight_D3-6_InsightReport.pdf).
- Managing and sharing data: best practice for researchers (2011).
(http://www.data-archive.ac.uk/media/2894/managingsharing.pdf).
- Research Data: Unseen Opportunities (2010). (http://www.carl-abrc.ca/about/working_groups/pdf/data_mgt_toolkit.pdf).

 

Nota

1. Angevaare, Inge (2009). "Taking care of digital collections and data: ‘Curation' and organisational choices for research libraries", Liber Quarterly, v. 19, no. 1, p. 6-7.