Biblioteques de recerca, Wikimedia i dades obertes enllaçades

Versión para impresiónVersión para impresión

David Rodríguez Mateos
Departamento de Comunicación
Universidad Carlos III de Madrid


ARL White Paper on Wikidata Opportunities and Recommendations (2019). ARL Task Force on Wikimedia and Linked Open Data. Washington D.C.: Association of Research Libraries – Wikimedia Foundation. 59 p. Disponible a: <https://www.arl.org/wp-content/uploads/2019/04/2019.04.18-ARL-white-paper-on-Wikidata.pdf>. [Consulta: 19/05/2020].


Com aconseguir que les principals biblioteques universitàries dels Estats Units i el Canadà, i alguns altres grans centres amb recursos d’informació pública d’aquests països, augmentin la visibilitat de les seves col·leccions, de les seves activitats i dels seus investigadors? I, com compartir esforços per aprofitar la seva experiència descrivint aquests continguts? Respondre, entre d’altres, a aquestes dues preguntes va ser el que va dur l’Association of Research Libraries (ARL) a unir les seves forces amb una de les iniciatives de difusió de coneixement col·laboratiu més conegudes del món: la Wikimedia Foundation, organització responsable de la Wikipedia.

A més d’algunes de les universitats més destacades d’aquests països, la ARL inclou com a  membres la National Library of Medicine i la NARA (National Archives and Records Administration), que agrupa nombrosos arxius públics dels Estats Units. Per part, seva Wikimedia manté, a més, altres col·leccions de dades com ara Wikimedia Commons, que reuneix diverses desenes de milions de recursos multimèdia de lliure accés, o Wikisource, que inclou tot tipus de documents històrics i d’altres fonts primàries.

Després de quatre anys de contactes, ambdós colossos van publicar el 2019 un informe conjunt on descriuen de quina manera podrien col·laborar en benefici mutu, i recomanen que aquesta col·laboració s'estengui entre els seus membres. Aquest text està basat en les experiències durant aquest període, com també en els possibles resultats que es podrien obtenir si s’estenen aquestes pràctiques.

La proposta de col·laboració entre la ARL i Wikimedia està basada en la relació prèvia de Wikimedia amb tot tipus de biblioteques, arxius, museus i centres d’art, tant als Estats Units (Biblioteca del Congrés, Smithsonian Museum o les universitats de Harvard, Princeton i Stanford, per citar alguns exemples) com a Europa (incloses les biblioteques nacionals del Regne Unit, França o Alemanya, entre d’altres).

En concret, les recomanacions incloses a l’informe van adreçades a l’ús, no de la Wikipedia en si, sinó de la seva principal eina per descriure dades, Wikidata. Wikidata és una base de coneixements de dades enllaçades estructurades, el lloc d’on surten aquestes caixes d’informació sobre data de naixement o població i densitat d’un país, premis, rècords, etc. 

Existeixen diverses raons per argumentar aquesta proposta de col·laboració. Una d’elles és que Wikidata no tan sols conté les dades utilitzades per elaborar la Wikipedia, sinó molts d’altres continguts addicionals. És a dir, no tots els objectes i metadades que conté Wikidata estan necessàriament a la Wikipedia, però sí són d’accés públic des del mateix moment en què són afegides i, per tant, són automàticament reutilitzables. A més, les metadades poden ser descrites mitjançant l’ús de múltiples fitxers d’autoritats que poden ser definits, ampliats i referenciats de forma immediata, entre si, per les biblioteques mateixes o per qualsevol altre institució. 

Des del punt de vista tècnic, les autoritats poden ser utilitzades mitjançant la combinació de les anomenades dades obertes enllaçades, o linked open data (LOD). Aquestes dades obertes enllaçades són referides mitjançant URI (uniform resource identifiers). És a dir: quan es fa referència a una metadada, s’utilitza la seva adreça en un vocabulari controlat (accessible a través d’Internet), que pot ser la que una o diverses biblioteques hagin emprat per definir aquest terme.

A més, aquestes metadades no tan sols defineixen els identificadors dels objectes, el que en LOD es coneix com a «ítems», o d’altres qualitats relacionades, como l’autor, o fins i tot un premi rebut: en LOD, aquests conceptes es denominen «valors». També són organitzades com a metadades les relacions entre ítems i valors: per exemple, la relació d’autoria d’un «valor» respecte d’un «ítem», que es coneixen com a «propietats». Aquestes propietats han d’haver estat prèviament usades a la Wikipedia, per bé que actualment existeixen diversos milers de propietats disponibles. 

Per tant, les combinacions entre ítems, propietats i valors ofereixen una gran flexibilitat. Això suposa que les metadades LOD utilitzades a Wikidata poden ser adaptables, modulades, esteses i aplicades a diferents necessitats que cada biblioteca té per crear els seus propis recursos informatius. En suma, les dades accessibles mitjançant Wikidata són molt proclius a formar part del que es coneix com a dades FAIR, és a dir, localitzables (findable), accessibles, interoperables i recuperables. Aquestes qualitats permeten també que qualsevol altra biblioteca al món, fins i tot amb recursos tecnològics més reduïts, pugui accedir a aquestes dades, adaptar-les per al seu propi ús i aplicar-les als seus continguts.

L’informe pot tenir un nivell tècnic mitjà alt per a lectors no familiaritzats amb la tecnologia linked open data i els conceptes de Wikidata o Wikibase, i ofereix exemples d’ús de Wikidata a les biblioteques, a arxius i a col·leccions especials. Així mateix, ofereix recomanacions pràctiques per implementar Wikibase i utilitzar Wikidata amb la finalitat de fomentar la visibilitat de col·leccions i materials que ajudin a millorar la inclusió de col·lectius, fins ara, infrarrepresentats tant en els materials de les biblioteques universitàries com en la Wikipedia mateixa: ja sigui per raons de gènere, de llengua o de raça.

En el mateix informe, s’inclou un apartat especial sobre l’ús de Wikidata en la comunicació científica, per senyalar que la col·laboració entre Wikidata i les biblioteques que pertanyen a la ARL, o qualssevol d’altres, també permetria la difusió de les dades sobre els autors universitaris i els seus treballs de recerca. Per identificar els autors, poden aplicar-se recursos d’identificació estesos internacionalment, com ara ORCID (open researcher and contributor ID) o VIAF (Virtual International Authority File). Aquestes opcions no restringeixen l’ús d’altre tipus d’identificadors, almenys, de manera explícita. 

Aquesta col·laboració també pot estendre’s, segons els autors del text, a l’ús de Wikibase, la tecnologia utilitzada per Wikimedia per a la creació de bases de dades locals que siguin interoperables amb les que manté directament la Fundació. No obstant, el document només insisteix en els seus avantatges genèrics, com les diferents possibilitats d’inserció de contingut, el manteniment continu de l’històric de canvis, o la mencionada capacitat de convertir qualsevol dada en interoperable. Sense entrar a fons en possibles requeriments tècnics, l’informe no passa de suggerir la seva implementació, i de citar alguns casos concrets ja desenvolupats, a manera d’assaigs.

Finalment, els redactors de l’informe són conscients que encara que Wikidata no pugui ser plantejada com una alternativa als actuals sistemes bibliotecaris sí pot ser una eina molt útil per estendre la difusió dels seus continguts, i dels seus investigadors, perquè es tracta d’una eina de descripció cada cop més acceptada internacionalment, i perquè l’ús de dades enllaçades sense requerir eines tecnològiques d’alt cost millora la interoperabilitat dels seus continguts. En definitiva, aquesta proposta pot ajudar les biblioteques de recerca: tant en la difusió de coneixement més enllà dels clàssics canals acadèmics com en la col·laboració amb d’altres institucions, universitàries o no.