«Humanities are different». ¿Cómo encajamos las humanidades en el modelo de datos abiertos?

Versió per a imprimirVersió per a imprimir

Sabina Batlle Baró
Arqueóloga y estudiante de doctorado
Facultat d’Informació i Mitjans Audiovisuals
Universitat de Barcelona (UB)


Ruediger, Dylan; MacDougall, Ruby (2023). Are the Humanities ready for data sharing? [New York]: Ithaka S+R. 14 p. Disponible en: <https://doi.org/10.18665/sr.318526>. [Consulta: 18/10/2023].


En los años 60, el ministro franquista Manuel Fraga intentaba sacar provecho de la mala fama y el aislamiento de la España del momento para atraer a los turistas con el lema «Spain is different». De una manera parecida, el estudio Are the Humanities ready for data sharing?, publicado por Ithaka S+R, se centra en las singularidades de las humanidades para analizar la compartición de datos (o su ausencia) y reivindicar la aportación que podrían hacer estas disciplinas al movimiento de datos abiertos.

El informe surge como consecuencia de la publicación, el 25 de agosto de 2022, del memorándum Ensuring free, immediate, and equitable access to federally funded research impulsado por Alondra Nelson, directora de la White House Office of Science and Technology Policy (OSTP), en los Estados Unidos. Este documento, popularmente conocido con el nombre de «Nelson memo», es una normativa federal que obliga a abrir las publicaciones y todos los datos generados a partir de investigaciones financiadas con fondos públicos. Es la primera vez en los Estados Unidos que una normativa de estas características hace referencia al National Endowment for the Humanities (NEH), una agencia financiadora federal que apoya específicamente la investigación en humanidades. Parece, pues, que alguien se ha dado cuenta de que las humanidades no estaban haciendo el trabajo, o que, para variar, no habían sido invitadas a la fiesta. 

Es a partir de esta publicación que los autores del estudio se preguntan por qué la compartición de datos en humanidades es marginal (solo un 20 % de los investigadores comparten habitualmente los datos, según los resultados de 2021 de la propia agencia Ithaka S+R), o qué valor pueden aportar las humanidades al movimiento de los datos abiertos. Para responder estas cuestiones, han entrevistado investigadores de cuatro proyectos de humanidades (digitales) con cierta experiencia en el tratamiento de datos, tres de ellos en marcha y uno ya finalizado.

De entrada, la pregunta básica que se plantean los investigadores al reflexionar sobre la compartición de datos en humanidades es si realmente se puede hablar de «datos», en humanidades. ¿Qué y cómo son estos datos? A pesar de que determinarlo queda fuera del alcance del estudio, sí que se plantea la dicotomía presente en las humanidades entre fuentes y datos, y el hecho de que muchos investigadores de estas disciplinas no consideren que analizan, recogen o crean datos. ¿Son datos las evidencias extraídas de la interpretación de un documento? ¿Las transcripciones de entrevistas? ¿Los corpus documentales? Esta duda fundacional plantea, ya de por si, un problema evidente a la hora de obligar a compartir los datos de investigación. Pero es que, además, cuando sí que se generan datos, estos son de lo más «problemáticos» desde el punto de vista de la compartición: desestructurados, caóticos, «resbaladizos», poco estandarizados, poco documentados, subjetivos, únicos… vaya, como la vida misma.

Más allá de este reto epistemológico, los escollos que dificultan la implementación del modelo no son diferentes de los identificados en estudios parecidos en otros campos: el temor al mal uso de los datos, las incertidumbres sobre los derechos de autor... unos escollos que, por las características intrínsecas de las humanidades, muchas veces se ven magnificados. De entrada, se argumenta la falta de tiempo, de recursos y de experiencia, factores acentuados en el caso de las humanidades por el hecho de que los equipos suelen ser pequeños e infrafinanciados. También la falta de infraestructuras que permitan depositar los datos y aseguren tanto la preservación como la descubribilidad, a causa, sobre todo, del déficit de repositorios disciplinares¹ y de la todavía incipiente, por no decir inexistente, cultura y comunidad de compartición de datos. Y, todavía, se esgrime la falta de motivación o incentivos qué, ¡sorpresa!, se hace también más evidente en las humanidades: por una parte, porque los mandatos de las agencias financiadoras no tienen el mismo impacto (muchas investigaciones son solo cofinanciadas o, incluso, se autofinancian), ni tampoco las promesas de incremento de citas (dado que el modelo de investigación y publicación natural de las humanidades no es el mismo de las ciencias STEM); y, por otra parte, porque los ideales de validación, transparencia, reproductibilidad y reutilización pierden valor en la manera de crear conocimiento de estas disciplinas, mucho más basadas en la interpretación que en el análisis «objetivo». Como podéis ver, carencias no faltan.

Como contrapunto a tanta negatividad, los autores del estudio intentan buscar la luz en las actuales prácticas de muchos proyectos de investigación en humanidades, que llevan desde hace tiempo haciendo una tarea ingente de divulgación de su investigación, de implementación de la ciencia ciudadana y de colaboración con las comunidades más allá de la academia. Unas acciones esperanzadoras, pero terriblemente exiguas cuando se comparan con la larga lista de trabas antes mencionadas.

A la hora de concluir el documento, los autores constatan la cruel realidad: que «los estándares y principios de la investigación abierta se han desarrollado con muy poca preocupación por las humanidades». Como respuesta a este hecho, hacen una llamada a «adaptar» en lugar de «adoptar», es decir, a iniciar el debate entre los humanistas para ver qué puede aportar este modelo a nuestras disciplinas, y cómo se puede transformar para que llegue a cubrir nuestras singularidades (o rarezas) y nuestras necesidades. Entre las posibles tareas, destaca la de fomentar la creación de una verdadera cultura de la compartición de datos, y de un sentimiento de comunidad. Y, de la misma forma, poner en valor la manera cómo las humanidades y su mentalidad, metodologías y procesos (lo que el estudio describe como «la manera humanística de pensar») pueden, por su parte, contribuir al modelo de datos abiertos. Ya sea ampliando el concepto de compartición de datos más allá de la academia, recalcando la importancia del contexto y la interpretación a la hora de compartir y reutilizar los datos o «humanizando» los datos, es decir, poniendo sobre la mesa temas delicados como la ética de la compartición o el impacto de estas prácticas de investigación sobre minorías y grupos marginalizados.

El informe es breve y no aporta muchas soluciones a un problema que justo acaba de empezar, pero que tiene raíces en una discriminación que viene de lejos. Aun así, es importante que, al menos, se digan algunas cosas claras: que hasta ahora se ha utilizado un sistema de talla única, y que se está intentando encajonar las humanidades en un modelo hecho a medida por las ciencias STEM, de una manera parecido a lo que ha pasado con los modelos actuales de publicación y evaluación de la producción científica. Y que está en manos de los humanistas iniciar el debate de cómo queremos entrar en el movimiento de datos abiertos (un debate que, al menos en algunas disciplinas como la arqueología y en muchos casos gracias al auge de las humanidades digitales, ja se está haciendo, pero nunca suficientemente). Porque, a pesar de que las humanidades «are different», al final los mandatos y las políticas de investigación nos afectan a todos por igual.

 

Imagen inicial: montaje de la autora a partir de un cartel del web del Centro Virtual Cervantes

1 Con una búsqueda rápida en el corpus de repositorios registrados en re3data.org, puede constatarse esta desproporción: hay 356 repositorios catalogados como «Humanidades», de un total de 3.160 (los repositorios pueden estar adscritos en más de una categoría). En este caso, se considera que las «Humanidades» incluyen las disciplinas de «Ancient cultures», «History», «Fine arts, music, theatre and media studies», «Linguistics», «Literary studies», «Non-European Languages and Cultures, Social and Cultural Anthropology, Jewish Studies and Religious Studies», «Theology» y «Philosophy». Como referencia, en el propio directorio se cuentan 1.011 repositorios de biología, 738 de medicina, 228 de agricultura, 260 de química, 342 de física o 496 de ciencias sociales.