Científica titular del CSIC
Mossink, W.; Bijsterbosch, M. (2013). European Landscape Study of Research Data Management. For SIM4RDM- Support Infrastructure Models for Research Data Management. Utrecht: SURF. 52 p. [Consulta: 10/10/2014]. Disponible a: <http://www.sim4rdm.eu/sites/default/files/uploads/documents/SIM4RDM%20landscape%20report%20final%2025.01.12.pdf>.
Aquest estudi forma part dels documents generats pel Projecte SIM4RDM (Support Infrastructure Models for Research Data Management) finançat per la Comissió Europea dins del Setè Programa Marc, i publicat per dos membres de SURF, institució sòcia del citat projecte. L'informe es va publicar el 2013, encara que els resultats i conclusions d'acord amb l'evolució que ha experimentat la gestió de les dades de recerca, continuen sent vàlids d'acord al paisatge europeu actual en aquest àmbit.
L'objectiu del treball va ser la revisió dels mecanismes d'intervenció que poden servir de suport als investigadors per a la gestió de les seves dades, tant en infraestructures com en les bones pràctiques per a la gestió de les dades generades en investigació.
La metodologia seguida va ser primer una revisió bibliogràfica per identificar i analitzar els possibles mecanismes d'intervenció ja existents i documentats, com l'informe Riding the Wave encarregat per la CE i publicat el 2010, les directrius de l'OCDE respecte a la gestió, accés i reutilització de les dades, les polítiques sobre dades d'algunes institucions americanes com el NIH o la NASA, i l'exemple del Regne Unit de polítiques sobre gestió de dades incloses en les polítiques de finançament dels Research Councils (RCUKs). El segon lloc es va realitzar una enquesta online dirigida a quatre sectors: organismes nacionals implicats en la gestió de dades, agències finançadores, institucions dedicades a la investigació i editors. Les preguntes volíen detectar quin tipus de mecanismes d'intervenció disposaven, si existien, respecte a la gestió de dades de recerca. Òbviament l'enquesta es va enfocar tenint en compte el paper de cadascuna d'aquestes parts, per això les qüestions no van ser mateixes per a tots.
La tercera part d'aquest informe ofereix els resultats obtinguts d'una enquesta adreçada a investigadors tenint en compte els resultats de la consulta prèvia. El nombre d'enquestats va ser baix, només 12 investigadors, per això convé prendre els resultats obtinguts de forma reservada i orientativa.
Deixo als lectors la consulta dels resultats quantitatius i qualitatius relacionats amb les dues enquestes i em cenyiré a les conclusions extretes de totes les respostes obtingudes. Respecte a les institucions finançadores de recerca, gairebé la meitat dels enquestats disposaven d'una política respecte a la gestió de dades (no cal oblidar que un dels socis del projecte pertany al Regne Unit on es localitzen bastants d'aquestes polítiques) i un quart d'aquests requereixen en les seves convocatòries la presentació d'un pla de gestió de dades. Els principals motius per fomentar la gestió de les dades tenen relació amb fer una ciència millor i el suport a l'accés obert a aquestes dades. D'acord amb aquestes institucions aquest pla hauria de tenir en compte els següents elements: com s'obtenen les dades, el seu ús i reutilització, emmagatzematge i preservació així com els drets de propietat dels mateixos.
Les institucions a nivell nacional que s'encarreguen d'una o altra manera de coordinar activitats dirigides a la gestió de dades de recerca, són entitats generalment dependents d'algun organisme governamental i les seves tasques estan enfocades a coordinar i facilitar l'accés a les eines i materials que permetin la preservació i l'establiment de bones pràctiques per compartir dades, assessorar les agències finançadores de la recerca en el tipus de polítiques, i en la creació d'infraestructures (veure pe el cas del Digital Curation Centre).
Les institucions dedicades a la investigació que van participar en l'enquesta no van diferir molt en les seves respostes, independentment de si disposaven d'una política declarada respecte a l'elaboració de plans de gestió de dades. Totes elles coincidien que els principals motors per impulsar l'elaboració dels plans de gestió, eren els requisits de les institucions finançadores inclosos en les convocatòries de finançament de projectes i l'existència de codis nacionals de conducta disciplinaris. Els elements que generalment s'inclouen en els seus plans de gestió es refereixen a: definició de les responsabilitats i rols implicats en la gestió de les dades, formació i suport, accés i reutilització seguretat, preservació, accés i disponibilitat de les dades en obert, que coincideixen bàsicament amb els elements considerats més important pels investigadors. Per promoure el dipòsit dels datasets, les institucions han de crear infraestructures per a això, recolzades en polítiques d'accés obert.
Finalment, de les respostes obtingudes d'editors de revistes científiques, que no van ser molts a respondre (10, dels quals 4 del Regne Unit), es va observar que la definició de polítiques respecte a les dades subjacents als articles d'investigació no és una pràctica habitual en les revistes, que tampoc utilitzen un estàndard per a la seva identificació (alguns els assignen dois), i per altra banda si no és un requisit, els autors són reticents a facilitar les dades. Els dos mecanismes d'intervenció amb més força proposats pels editors van ser, d'una banda requerir el dipòsit de les dades en un repositori fiable i enllaçar la seva localització a la feina i el segon la publicació dels datasets en revistes amb aquest perfil, com ara Gigascience o les revistes publicades per Pensoft.
Pel que fa a les recomanacions fetes a partir dels resultats obtinguts i de la visió dels autors de l'informe, es poden resumir en:
• Les institucions finançadores han de potenciar la inclusió de plans de gestió de dades en les seves convocatòries de projectes, acceptar en els pressupostos possibles despeses derivades d'aquesta gestió, recomanar els centres on emmagatzemar les dades, definir directrius clares de com redactar un pla de gestió de dades i identificar els elements claus en la definició del pla.
• Per als centres nacionals relacionats amb la gestió de dades es recomana la creació de codis de conducta on es descriguin les responsabilitats de les parts implicades i bones pràctiques, suggerir i facilitar les eines per a la implementació d'aquestes pràctiques, establir normes o procediments de com citar les dades i coordinar activitats relacionades amb la gestió de dades.
• Per a les institucions dedicades a la investigació, la creació de polítiques clares respecte a la gestió de dades, que incloguin els elements necessaris per a això, com la formació del personal, l'accés, la preservació i la salvaguarda de les dades, proveir de models per implementar un pla de gestió de dades i exposar casos exemplars que ajudin els investigadors a seguir-los, crear la infraestructura necessària i fiable per a l'arxiu i distribució dels datasets, incentivar i reconèixer el compartir les dades, i facilitar el personal necessari per assessorar sobre temes de llicències i de propietat intel·lectual.
• A les editorials, a establir un diàleg entre editors i associacions professionals per establir polítiques respecte a la provisió de les dades subjacents als treballs, mitjançant incentius com l'assignació d'identificadors persistents als datasets i la recomanació d'on dipositar-los.
Des del meu punt de vista aquest informe fa un recorregut bastant exhaustiu en matèria de gestió de dades i ofereix unes recomanacions d'acord amb l'assaig pilot de la Comissió Europea d'accés obert a les dades en el marc del programa H2020. En aquest pla pilot, la Comissió requereix l'elaboració d'un pla de gestió de dades un cop aprovat el projecte, que s'ha de facilitar en un període de no més de sis mesos des del seu inici, encara que també estableix el mecanisme pel qual, en cas de no poder complir amb aquesta política, pugui quedar exempt del seu compliment (veure http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf).
L'únic defecte, per dir-ho d'alguna manera, que li trobo a aquest document és que no faciliti en forma d'annexos els formularis originals de les enquestes.