Bibliotecas de investigación, Wikimedia y datos abiertos enlazados

Versió per a imprimirVersió per a imprimir

David Rodríguez Mateos
Departamento de Comunicación
Universidad Carlos III de Madrid


ARL White Paper on Wikidata Opportunities and Recommendations (2019). ARL Task Force on Wikimedia and Linked Open Data. Washington D.C.: Association of Research Libraries – Wikimedia Foundation. 59 p. Disponible en: <https://www.arl.org/wp-content/uploads/2019/04/2019.04.18-ARL-white-paper-on-Wikidata.pdf>. [Consulta: 19/05/2020].


¿Cómo conseguir que las principales bibliotecas universitarias de Estados Unidos y Canadá, y algunos otros grandes centros con recursos de información pública de esos países, aumenten la visibilidad de sus colecciones, de sus actividades y de sus investigadores? ¿Y, cómo compartir esfuerzos para aprovechar su experiencia describiendo esos contenidos? Responder, entre otras, a estas dos preguntas fue lo que llevó a la Association of Research Libraries (ARL) a unir sus fuerzas con una de las iniciativas de difusión de conocimiento colaborativo más conocidas del mundo: la Wikimedia Foundation, organización responsable de la Wikipedia.

Además de algunas de las universidades punteras de estos países, la ARL incluye como miembros a la National Library of Medicine y a la NARA (National Archives and Records Administration), que agrupa a numerosos archivos públicos de Estados Unidos. Por su parte, Wikimedia mantiene, además, otras colecciones de datos como Wikimedia Commons, que reúne varias decenas de millones de recursos multimedia de libre acceso, o Wikisource, que incluye todo tipo de documentos históricos y otras fuentes primarias.

Tras cuatro años de contactos, ambos colosos publicaron en 2019 un informe conjunto en el que describen cómo podrían colaborar en beneficio mutuo, y recomiendan que esa colaboración se extienda entre sus miembros. Ese texto está basado en las experiencias durante ese período, así como en los posibles resultados que podrían obtenerse si se extienden esas prácticas.

La propuesta de colaboración entre la ARL y Wikimedia está basada en la relación previa de Wikimedia con todo tipo de bibliotecas, archivos, museos y centros de arte, tanto en Estados Unidos (Biblioteca del Congreso, Smithsonian Museum o las universidades de Harvard, Princeton y Stanford, por citar algunos ejemplos) como en Europa (incluidas las bibliotecas nacionales del Reino Unido, Francia o Alemania, entre otras).

En concreto, las recomendaciones incluidas en el informe van dirigidas al uso, no de la Wikipedia en sí, sino de su principal herramienta para describir datos, Wikidata. Wikidata es una base de conocimientos de datos enlazados estructurados, el lugar de donde salen esas cajas de información sobre fecha de nacimiento o población y densidad de un país, premios, récords, etc. 

Existen varias razones para argumentar esta propuesta de colaboración. Una de ellas es que Wikidata no solo contiene los datos empleados para elaborar la Wikipedia, sino otros muchos contenidos adicionales. Es decir, no todos los objetos y metadatos que contiene Wikidata están necesariamente en la Wikipedia, pero sí son de acceso público desde el mismo momento en que son añadidos y, por lo tanto, son automáticamente reutilizables. Además, los metadatos pueden ser descritos mediante el uso de múltiples ficheros de autoridades que pueden ser definidos, ampliados y referenciados de forma inmediata, entre sí, por las propias bibliotecas o por cualquier otra institución. 

Desde el punto de vista técnico, las autoridades pueden ser empleadas mediante la combinación de los llamados datos abiertos enlazados, o linked open data (LOD). Estos datos abiertos enlazados son referidos mediante URI (uniform resource identifiers). Es decir: cuando se hace referencia a un metadato, se emplea la dirección de este en un vocabulario controlado (accesible a través de Internet), que puede ser el que una o varias bibliotecas hayan empleado para definir ese término.

Además, esos metadatos no solo definen los identificadores de los objetos, lo que en LOD se conoce como «ítems», u otras cualidades relacionadas, como el autor, o incluso un premio recibido: en LOD, estos conceptos se denominan «valores». También son organizados como metadatos las relaciones entre ítems y valores: por ejemplo, la relación de autoría de un «valor» respecto a un «ítem», que se conocen como «propiedades». Estas propiedades deben haber sido previamente usadas en la Wikipedia, aunque en la actualidad existen varios miles de propiedades disponibles. 

Por lo tanto, las combinaciones entre ítems, propiedades y valores ofrecen una gran flexibilidad. Eso supone que los metadatos LOD empleados en Wikidata pueden ser adaptables, modulados, extendidos y aplicados a diferentes necesidades que cada biblioteca tiene para crear sus propios recursos informativos. En suma, los datos accesibles mediante Wikidata son muy proclives a formar parte de lo que se conoce como datos FAIR, es decir, localizables (findable), accesibles, interoperables y recuperables. Estas cualidades permiten también que cualquier otra biblioteca en el mundo, incluso con recursos tecnológicos más reducidos, pueda acceder a estos datos, adaptarlos para su propio uso y aplicarlos en sus contenidos.

El informe puede tener un nivel técnico medio alto para lectores no familiarizados con la tecnología linked open data y los conceptos de Wikidata o Wikibase, y ofrece ejemplos de uso de Wikidata en las bibliotecas, en archivos y en colecciones especiales. Asimismo, ofrece recomendaciones prácticas para implementar Wikibase y utilizar Wikidata con el fin de fomentar la visibilidad de colecciones y materiales que ayuden a mejorar la inclusión de colectivos, hasta ahora, infrarrepresentados tanto en los materiales de las bibliotecas universitarias como en la propia Wikipedia: ya sea por razones de género, de lengua o de raza.

En el mismo informe, se incluye un apartado especial sobre el uso de Wikidata en la comunicación científica, para señalar que la colaboración entre Wikidata y las bibliotecas que pertenecen a la ARL, u otras cualesquiera, también permitiría la difusión de los datos sobre los autores universitarios y sus trabajos de investigación. Para identificar a los autores, pueden aplicarse recursos de identificación extendidos internacionalmente, como ORCID (open researcher and contributor ID) o VIAF (Virtual International Authority File). Estas opciones no restringen el uso de otro tipo de identificadores, al menos, de manera explícita. 

Esta colaboración también puede extenderse, según los autores del texto, al uso de Wikibase, la tecnología empleada por Wikimedia para la creación de bases de datos locales que sean interoperables con las que mantiene directamente la Fundación. No obstante, el documento solo insiste en sus ventajas genéricas, como las diferentes posibilidades de inserción de contenido, el mantenimiento continuo del histórico de cambios, o la mencionada capacidad de convertir cualquier dato en interoperable. Sin entrar a fondo en posibles requerimientos técnicos, el informe no pasa de sugerir su implementación, y de citar algunos casos concretos ya desarrollados, a modo de ensayos.

Por último, los redactores del informe son conscientes de que aunque Wikidata no pueda ser planteada como una alternativa a los actuales sistemas bibliotecarios sí puede ser una herramienta muy útil para extender la difusión de sus contenidos, y de sus investigadores, porque se trata de una herramienta de descripción cada vez más aceptada internacionalmente, y porque el uso de datos enlazados sin requerir herramientas tecnológicas de alto coste mejora la interoperabilidad de sus contenidos. En definitiva, esta propuesta puede ayudar a las bibliotecas de investigación: tanto en la difusión de conocimiento más allá de los clásicos canales académicos como en la colaboración con otras instituciones, universitarias o no.