Mecanismos de intervención para la gestión de datos

Versión para impresiónVersión para impresión
Remedios Melero
Científica titular del CSIC

 

Mossink, W.; Bijsterbosch, M. (2013). European Landscape Study of Research Data Management. For SIM4RDM- Support Infrastructure Models for Research Data Management. Utrecht: SURF. 52 p. [Consulta: 10/10/2014]. Disponible a: <http://www.sim4rdm.eu/sites/default/files/uploads/documents/SIM4RDM%20landscape%20report%20final%2025.01.12.pdf>.

Este estudio forma parte de los documentos generados por el Proyecto SIM4RDM (Support Infrastructure Models for Research Data Management) financiado por la Comisión Europea dentro del Séptimo Programa Marco, y publicado por dos miembros de SURF, institución socia del citado proyecto. El informe se publicó en 2013, aunque los resultados y conclusiones de acuerdo con la evolución que ha experimentado la gestión de los datos de investigación, continúan siendo válidos de acuerdo al paisaje europeo actual en ese ámbito.

El objetivo del trabajo fue la revisión de los mecanismos de intervención que puedan servir de apoyo a los investigadores para la gestión de sus datos, tanto en infraestructuras como en las buenas prácticas para la gestión de los datos generados en investigación.

La metodología seguida fue primero una revisión bibliográfica para identificar y analizar los posibles mecanismos de intervención ya existentes y documentados, como el informe Riding the Wave encargado por la CE y publicado en 2010, las directrices de la OCDE respecto a la gestión, acceso y reutilización de los datos, las políticas sobre datos de algunas instituciones americanas como el NIH o la NASA, y el ejemplo de UK de políticas sobre gestión de datos incluidas en las políticas de financiación de los Research Councils (RCUKs). En segundo lugar se realizó una encuesta online dirigida a cuatro sectores: organismos nacionales implicados en la gestión de datos, agencias financiadoras, instituciones dedicadas a la investigación y editores. Las preguntas se dirigieron a detectar que tipo de mecanismos de intervención disponían, si existían, respecto a la gestión de datos de investigación. Obviamente la encuesta se enfocó teniendo en cuenta el rol de cada una de estas partes, por ello las cuestiones no fueron las mismas para todos.

La tercera parte de este informe ofrece los resultados obtenidos de una encuesta dirigida a investigadores teniendo en cuenta los resultados de la consulta previa. El número de encuestados fue bajo, solo 12 investigadores, por ello conviene tomar los resultados obtenidos de forma reservada y orientativa.

Dejo a los lectores la consulta de los resultados cuantitativos y cualitativos relacionados con ambas encuestas y me ceñiré a las conclusiones extraídas de todas las respuestas obtenidas. Respecto a las instituciones financiadoras de investigación, casi la mitad de los encuestados disponían de una política respecto a la gestión de datos (no hay que olvidar que uno de los socios del proyecto pertenece al Reino Unido dónde se localizan bastantes de estas políticas) y un cuarto de estos requieren en sus convocatorias la presentación de un plan de gestión de datos. Los principales motivos para fomentar la gestión de los datos tienen que ver con hacer una ciencia mejor y el apoyo al acceso abierto a estos datos. De acuerdo con estas instituciones este plan debería tener en cuenta los siguientes elementos: cómo se obtienen los datos, su uso y reutilización, almacenamiento y preservación así como los derechos de propiedad de los mismos.

Las instituciones a nivel nacional que se encargan de una u otra manera de coordinar actividades dirigidas a la gestión de datos de investigación, son entidades generalmente dependientes de algún organismo gubernamental y sus tareas están enfocadas a coordinar y facilitar el acceso a las herramientas y materiales que permitan la preservación y el establecimiento de buenas prácticas para compartir datos, asesorar a las agencias financiadoras de la investigación en el tipo de políticas, y en la creación de infraestructuras ( ver p.e. el caso del Digital Curation Centre).

Las instituciones dedicadas a la investigación que participaron en la encuesta no difirieron mucho en sus respuestas, independientemente de si disponían de una política declarada respecto a la elaboración de planes de gestión de datos. Todas ellas coincidían en que los principales motores para impulsar la elaboración de los planes de gestión, eran los requisitos de las instituciones financiadoras incluidos en las convocatorias de financiación de proyectos y la existencia de códigos nacionales de conducta disciplinares. Los elementos que generalmente se incluyen en sus planes de gestión se refieren a: definición de las responsabilidades y roles implicados en la gestión de los datos, formación y apoyo, acceso y reutilización seguridad, preservación, acceso y disponibilidad de los datos en abierto, que coinciden básicamente con los elementos considerados más importantes por los investigadores. Para promover el depósito de los datasets, las instituciones deben crear infraestructuras para ello apoyadas en políticas de acceso abierto.

Por último, de las respuestas obtenidas de editores de revistas científicas, que no fueron muchos en responder (10, de ellos 4 del Reino Unido), se observó que la definición de políticas respecto a los datos que subyacen a los artículos de investigación no es una práctica habitual en las revistas, que tampoco utilizan un estándar para su identificación (algunos les asignan DOIs), y por otro lado si no es un requisito, los autores son reticentes a facilitar los datos. Los dos mecanismos de intervención con más fuerza propuestos por los editores fueron, por un lado requerir el depósito de los datos en un repositorio fiable y enlazar su localización al trabajo y el segundo la publicación de los datasets en revistas con este perfil, como por ejemplo Gigascience o las revistas publicadas por Pensoft.

En cuanto a las recomendaciones hechas a partir de los resultados obtenidos y de la visión de los autores del informe, pueden resumirse en:

• Las instituciones financiadoras deben potenciar la inclusión de planes de gestión de datos en sus convocatorias de proyectos, aceptar en los presupuestos posibles gastos derivados de esta gestión, recomendar los centros dónde almacenar los datos, definir directrices claras de cómo redactar un plan de gestión de datos e identificar los elementos claves en la definición del plan.

• Para los centros nacionales relacionados con la gestión de datos se recomienda la creación de códigos de conducta donde se describan las responsabilidades de las partes implicadas y buenas prácticas, sugerir y facilitar las herramientas para la implementación de dichas prácticas, establecer normas o procedimientos de cómo citar los datos y coordinar actividades relacionadas con la gestión de datos.

• Para las instituciones dedicadas a la investigación, la creación de políticas claras respecto a la gestión de datos, que incluyan los elementos necesarios para ello, como la formación del personal, el acceso, la preservación y la salvaguarda de los datos, proveer de modelos para implementar un plan de gestión de datos y exponer casos ejemplares que ayuden a los investigadores a seguirlos, crear la infraestructura necesaria y fiable para el archivo y distribución de los datasets, incentivar y reconocer el compartir los datos, y facilitar el personal necesario para asesorar sobre temas de licencias y de propiedad intelectual.

• A las editoriales, a establecer un diálogo entre editores y asociaciones profesionales para establecer políticas respecto a la provisión de los datos subyacentes a los trabajos, mediante incentivos como la asignación de identificadores persistentes a los datasets y la recomendación de dónde depositarlos.

Desde mi punto de vista este informe hace un recorrido bastante exhaustivo en materia de gestión de datos y ofrece unas recomendaciones acordes con el ensayo piloto de la Comisión Europea de acceso abierto a los datos en el marco del programa H2020. En este plan piloto, la Comisión requiere la elaboración de un plan de gestión de datos una vez aprobado el proyecto, que debe facilitarse en un periodo de no más de seis meses desde su inicio, aunque también establece el mecanismo por el cual, en caso de no poder cumplir con esta política, pueda quedar exento de su cumplimiento (ver http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf).

El único defecto, por decirlo de alguna manera, que le encuentro a este documento es que no facilite en forma de anexos los formularios originales de las encuestas.