Una pleamar de datos

Versión para impresiónVersión para impresión
Remedios Melero
Científica titular del CSIC
Miembro del grupo Acceso Abierto a la Ciencia (www.accesoabierto.net)
 

—Riding the wave: how Europe can gain from the rising tide of scientific data. Final report of the High Level Expert Group on Scientific Data: a submission to the European Commission. October 2010. <http://ec.europa.eu/information_society/newsroom/cf/itemlongdetail.cfm?item_id=6204>.

El título de este informe ya es de por sí sugerente "Subir a la cresta de la
ola: como Europa puede beneficiarse de la creciente marea de datos científicos". El documento es el resultado de las reuniones y de las conclusiones a que llegaron un grupo de expertos procendentes de diversas universidades e instituciones de investigación a los que la Comisión Europea les encargó un informe sobre la visión futura de los beneficios y del coste de la puesta en marcha de una e-infraestructura global de datos. Esta debería permitir a los investigadores de diferentes áreas de conocimiento y lugares, compartir datos y trabajar con ellas. La aproximación permitiría generar nuevas correlaciones, ideas e información a un nivel que todavía estamos lejos de vislumbrar.


Ante el reto puesto al grupo de trabajo de dar respuestas mirando hacia el futuro, más concretamente en el año 2030, lo primero que hicieron sus miembros fue plantearse algunas preguntas para poder perfilar las acciones a tomar:

- ¿Cómo se puede organizar un esfuerzo global de estas características sin perder flexibilidad y apertura?
- ¿Cómo se puede incentivar a investigadores, empresas y otros facilitadores contribuir a esta e-infraestructura manteniendo su privacidad y propiedad?
- ¿Cómo se pueden preservar estos datos, independientemente de la tecnología usada para su generación?
- ¿Cómo se puede establecer el contexto y procedencia de los datos?
- ¿Cómo se puede pagar por toda esta infraestructura?

La idea conceptual de partida de una e-infraestructura está basada en una estructura en que se facilite el acceso, se garantice el uso y la reutilización de los datos, y su fiabilidad. De acuerdo con la visión del grupo de expertos y mirando al futuro, esta infraestructura tendría las siguientes características:

- Todas las partes implicadas, desde los investigadores al público en general, deberían ser conscientes de la importancia de conservar y compartir datos fiables durante la investigación científica.

- Los investigadores deberían ser capaces de encontrar, acceder y procesar los datos que puedan necesitar.

- Los productores de los datos se beneficiarían de esta apertura y preferentemente depositarían sus datos en depósitos que disfrutaran de confianza y fiabilidad.

- La financiación pública aumentaría, al ver recompensadas, reinvertidas y casi amortizadas las cantidades invertidas en investigación. La propia empresa privada podría beneficiarse del acceso a los datos públicos y compartir los propios.

- Los políticos podrían tomar decisiones basadas en evidencias y hacer un seguimiento del impacto de estas decisiones.

Para poder alcanzar esta visión se proponen una serie de acciones que no sólo afectarían a Europa sino a los países científicamente muy desarrollados como Japón y EEUU. Son las siguientes:

1. La creación de un marco internacional para una infraestructura colaborativa de datos.
2. Asignar fondos adicionales para la e-infraestructura.
3. Desarrollar y utilizar nuevas formas de medir el valor de los datos y recompensarlo.
4. Formar una generación de científicos en la gestión de datos e incluir en los programas curriculares académicos asignaturas que incluyan gestión y manejo de datos.
5. Crear incentivos para el uso y desarrollo de tecnologías no contaminantes para la creación de la infraestructura de datos.
6. Creación de un comité interministerial de alto nivel con representantes internacionales que se reúna periódicamente para discutir sobre la dirección del e-infraestructura científica.

Para aquellos que su visión de progreso y reconocimiento profesional se basa en el documento elaborado (dígase artículo, libro, capítulo, informe, etc.) esta visión aún está lejos de verse. Sin embargo, en ciertos proyectos, sería inconcebible avanzar sin esta "globalización de datos", como por ejemplo en la investigación sobre el cambio climático y el medio ambiente, los fondos marinos, la física de partículas, temas energéticos, datos epidemiológicos, astronomía, etc.

El dato es el resultado de toda investigación científica. Un artículo científico, por su parte, representa la contextualización de estos resultados, la aplicación de una metodología para su interpretación y, finalmente, la inferencia de unas conclusiones basadas en estos. El documento que contiene estas partes puede quedar obsoleto, pero no los datos en sí, porque pueden ser reutilizadas, reprocesadas, tratadas con otra tecnología o simplemente vistas bajo otra perspectiva, este es su valor intrínseco. La e-infraestructura, además de ayudar a poder manejar una gran cantidad de datos, permite la creación de nuevos objetos digitales construidos a partir de los primeros, así como servicios basados en los datos contenidos en los depósitos digitales donde se encuentran alojados.

Además de articular una infraestructura tecnológica interoperable capaz de albergar y manejar grandes bases de datos, hay que pensar, tal y como se avanza en el inicio del informe, en cómo integrar todas las partes implicadas en el proceso y como incentivar la participación, sobre todo de los investigadores.

Al final del informe se hace un balance de las seis acciones anteriores, siempre con la visión puesta en 2030, de su potencial impacto y los riesgos posibles si no se implementan las acciones pertinentes para alcanzar estos objetivos.

El informe se acompaña de unos anexos en forma de tablas que resumen los objetivos, con las recomendaciones para alcanzarlos y los posibles impedimentos que puedan surgir en la creación de una e-infraestructura de datos.