«Humanities are different». Com encaixem les humanitats en el model de dades obertes?

Versió per a imprimirVersió per a imprimir

Sabina Batlle Baró
Arqueòloga i estudiant de doctorat
Facultat d’Informació i Mitjans Audiovisuals
Universitat de Barcelona (UB)


Ruediger, Dylan; MacDougall, Ruby (2023). Are the Humanities ready for data sharing? [New York]: Ithaka S+R. 14 p. Disponible a: <https://doi.org/10.18665/sr.318526>. [Consulta: 18/10/2023].


Als anys 60, el ministre franquista Manuel Fraga intentava treure profit de la mala fama i l’aïllament de l’Espanya del moment per atraure els turistes amb el lema «Spain is different». D’una manera semblant, l’estudi Are the Humanities ready for data sharing?, publicat per Ithaka S+R, se centra en les singularitats de les humanitats per analitzar-ne la compartició de dades (o la seva absència) i reivindicar l’aportació que podrien fer aquestes disciplines al moviment de dades obertes.

L’informe sorgeix com a conseqüència de la publicació, el 25 d’agost de 2022, del memoràndum Ensuring free, immediate, and equitable access to federally funded research impulsat per Alondra Nelson, directora de la White House Office of Science and Technology Policy (OSTP), als Estats Units d’Amèrica (EUA). Aquest document, popularment conegut amb el nom de «Nelson memo», és una normativa federal que obliga a obrir les publicacions i totes les dades generades a partir de recerques finançades amb fons públics. És la primera vegada als EUA que una normativa d’aquestes característiques fa referència al National Endowment for the Humanities (NEH), una agència finançadora federal que dona suport específicament a la recerca en humanitats. Sembla, doncs, que algú s’ha adonat que les humanitats no estaven fent la feina, o que, per variar, no havien estat convidades a la festa. 

És arran d’aquesta publicació que els autors de l’estudi es pregunten per què la compartició de dades en humanitats és marginal (només un 20 % dels investigadors comparteixen habitualment les dades, segons els resultats de 2021 de la mateixa agència Ithaka S+R), o quin valor poden aportar les humanitats al moviment de les dades obertes. Per respondre aquestes qüestions, han entrevistat investigadors de quatre projectes d’humanitats (digitals) amb certa experiència en el tractament de dades, tres d’ells en marxa i un ja acabat.

D’entrada, la pregunta bàsica que es plantegen els investigadors en reflexionar sobre la compartició de dades en humanitats és si realment es pot parlar de «dades», en humanitats. Què i com són aquestes dades? Malgrat que determinar-ho queda fora de l’abast de l’estudi, sí que es planteja la dicotomia present a les humanitats entre fonts i dades, i el fet que molts investigadors d’aquestes disciplines no considerin que analitzen, recullen o creen dades. Són dades les evidències extretes de la interpretació d’un document? Les transcripcions d’entrevistes? Els corpus documentals? Aquest dubte fundacional planteja, ja de per si, un problema evident a l’hora d’obligar a compartir les dades de recerca. Però és que, a més a més, quan sí que es generen dades, aquestes són d’allò més «problemàtiques» des del punt de vista de la compartició: desestructurades, caòtiques, «relliscoses», poc estandarditzades, poc documentades, subjectives, úniques… vaja, com la vida mateixa.

Més enllà d’aquest repte epistemològic, els esculls que dificulten la implementació del model no són diferents dels identificats en estudis semblants en altres camps: la por al mal ús de les dades, les incerteses sobre els drets d’autor... uns esculls que, per les característiques intrínseques de les humanitats, sovint es veuen magnificats. D’entrada, s’argumenta la manca de temps, de recursos i d’experiència, factors accentuats en el cas de les humanitats pel fet que els equips solen ser petits i infrafinançats. També la manca d’infraestructures que permetin dipositar les dades i n’assegurin tant la preservació com la descobribilitat, a causa, sobretot, del dèficit de repositoris disciplinaris¹ i de l’encara incipient, per no dir inexistent, cultura i comunitat de compartició de dades. I, encara, s’esgrimeix la manca de motivació o incentius que, sorpresa!, es fa també més evident en les humanitats: per una banda, perquè els mandats de les agències finançadores no tenen el mateix impacte (moltes recerques són només cofinançades o, fins i tot, s’autofinancen), ni tampoc les promeses d’increment de citacions (ja que el model de recerca i publicació natural de les humanitats no és el mateix de les ciències STEM); i, per l’altra, perquè els ideals de validació, transparència, reproductibilitat i reutilització perden valor en la manera de crear coneixement d’aquestes disciplines, molt més basades en la interpretació que en l’anàlisi «objectiva». Com podeu veure, de mancances no en falten.

Com a contrapunt a tanta negativitat, els autors de l’estudi intenten buscar la llum en les actuals pràctiques de molts projectes de recerca en humanitats, que porten des de fa temps fent una tasca ingent de divulgació de la seva recerca, d’implementació de la ciència ciutadana i de col·laboració amb les comunitats més enllà de l’acadèmia. Unes accions esperançadores, però terriblement minses quan es comparen amb la llarga llista de pegues abans esmentades.

A l’hora de concloure el document, els autors constaten la cruel realitat: que «els estàndards i principis de la recerca oberta s’han desenvolupat amb ben poca preocupació per les humanitats». Com a resposta a aquest fet, fan una crida a «adaptar» en lloc d’«adoptar», és a dir, a iniciar el debat entre els humanistes per veure què pot aportar aquest model a les nostres disciplines, i com es pot transformar perquè arribi a cobrir les nostres singularitats (o rareses) i les nostres necessitats. Entre les possibles tasques, destaca la de fomentar la creació d’una veritable cultura de la compartició de dades, i d’un sentiment de comunitat. I, de la mateixa forma, posar en valor la manera com les humanitats i la seva mentalitat, metodologies i processos (el que l’estudi descriu com «la manera humanística de pensar») poden, per la seva banda, contribuir al model de dades obertes. Ja sigui ampliant el concepte de compartició de dades més enllà de l’acadèmia, recalcant la importància del context i la interpretació a l’hora de compartir i reutilitzar les dades o «humanitzant» les dades, és a dir, posant sobre la taula temes delicats com l’ètica de la compartició o l’impacte d’aquestes pràctiques de recerca sobre minories i grups marginalitzats.

L’informe és breu i no aporta gaires solucions a un problema que tot just acaba de començar, però que té arrels en una discriminació que ve de lluny. Tot i això, és important que, almenys, es diguin algunes coses clares: que fins ara s’ha fet servir un sistema de talla única, i que s’està intentant fer entrar amb calçador les humanitats en un model fet a mida per a les ciències STEM, d’una manera semblant al que ha passat amb els models actuals de publicació i avaluació de la producció científica. I que és en mans dels humanistes iniciar el debat de com volem entrar en el moviment de dades obertes (un debat que, almenys en algunes disciplines com l’arqueologia i en molts casos gràcies a l’auge de les humanitats digitals, ja s’està fent, però mai prou). Perquè, malgrat que les humanitats «are different», al final els mandats i les polítiques de recerca ens afecten a tots per igual.

Imatge inicial: muntatge de l’autora a partir d’un rètol del web del Centro Virtual Cervantes

1 Amb una cerca ràpida al corpus de repositoris registrats a re3data.org, es pot constatar aquesta desproporció: hi ha 356 repositoris catalogats com a «Humanitats», d’un total de 3.160 (els repositoris poden estar adscrits a més d’una categoria). En aquest cas, es considera que les «Humanitats» inclouen les disciplines de «Ancient cultures», «History», «Fine arts, music, theatre and media studies», «Linguistics», «Literary studies», «Non-European Languages and Cultures, Social and Cultural Anthropology, Jewish Studies and Religious Studies», «Theology» i «Philosophy». Com a referència, en el mateix directori es compten 1.011 repositoris de biologia, 738 de medicina, 228 d’agricultura, 260 de química, 342 de física o 496 de ciències socials.