Estrategias para publicar información bibliográfica en Linked Open Data

Versión para impresiónVersión para impresión

Xavier Agenjo
Fundación Ignacio Larramendi


Subirats, Imma; Lei Zeng, Marcia (2012). LODE BD Recommendations 2.0: Report on how to select appropriate encoding strategies for producing Linked Open Data (LOD) - enabled bibliographical data. Roma: AIMS-FAO of the United Nations, 2012. Disponible en: <http://www.digitalmeetsculture.net/wp-content/uploads/2012/10/LODE-BD-2.pdf>. [Consulta: 20 marzo 2013].

Open Data Stickers

Por fortuna el número de conjuntos de datos publicados en Linked Open Data va aumentando de forma notable, aunque no tanto el número de aplicaciones capaces de manejarlas con toda la potencialidad que esa tecnología supone. De hecho en el próximo congreso de IFLA que se celebra este año en Singapore, se llevará a cabo un Workshop titulado User Interaction Built on Library Linked Data (UILLD) y es que en efecto desde que en 2008 la Biblioteca Nacional de Suecia comenzó a publicar sus ficheros de autoridades y su información bibliográfica en Linked Open Data la tendencia no ha hecho más que crecer.

La publicación en octubre de 2011 del Informe Final del W3C Library Linked Data Incubator Group definió con nitidez las prácticas y los objetivos que debían seguir las bibliotecas (y los archivos y los museos) con el propósito de hacer disponibles sus conjuntos de datos. Sin embargo, ese Informe Final no descendía al detalle, ya que se trataba de recomendaciones de carácter genérico. Por eso es tan importante la publicación, ya en su versión 2.0, de las LODE-BD Recommendations preparada por Imma Subirats y por Marcia Lei Zeng. Entre paréntesis debe señalarse que Marcia Lei Zeng fue la traductora del Informe Final al chino y que participó en la redacción del mismo Informe Final. Esta traducción apareció apenas unos días después de la traducción española.

El proyecto de dos bibliotecarias tan expertas como Subirats y Lei Zeng queda perfectamente establecido ya en el subtítulo de las recomendaciones: "Report on how to select appropriate enconding strategies for producing Linked Open Data (LOD) enabled bibliographical data".

Se trata, pues de un instrumento de trabajo extraordinariamente útil para quién tenga el propósito, y ese quién debería abarcar prácticamente a toda la profesión, de publicar en Linked Open Data sus datos bibliotecarios (y archivísticos y museológicos). El indudable éxito de Europeana, que ha superado ya los 25 millones de objetos digitales, utilizando una estructura, el Europeana Data Model, que participa plenamente de los principios del W3C Library Linked Data Incubator Group se va a ver sin duda alguna fuertemente refrendado a partir del día 18 de abril con el lanzamiento de la Digital Public Library of America cuya última versión de su perfil de aplicación está fuertemente basada en EDM, incluso utilizando una parte considerable de su modelo de datos.

El documento que se reseña está basado en una estructura sumamente clara, pues tras unas recomendaciones de carácter general y un repaso a los esquemas de metadatos más importantes, despliega una serie de árboles de decisiones a partir de los cuáles es posible establecer propuestas para las propiedades individuales. Así, se proporcionan árboles para información sobre el título, para la entidad responsable, diferenciando entre creador, contribuidor y editor; para las características físicas; para la información sobre los ejemplares y su localización; y, por supuesto, y en un panorama RDA, que empezará a hacerse notar justamente el 1 de abril próximo, con las condiciones de la disponibilidad.

También se analiza el flujo de decisiones sobre la asignación de materias, la descripción del contenido, los derechos de propiedad intelectual y de uso, dejando el último análisis para las relaciones que pueden establecerse entre distintos recursos y entre distintos agentes.

El carácter eminentemente didáctico y práctico del documento es indudable y de enorme utilidad para quien sin un conocimiento muy profundo de la materia ha de enfrentarse con un proyecto que tenga como objetivo el de la publicación de los datos en Linked Open Data. Sin duda, para quienes han recorrido el camino de la edición de conjuntos de datos hasta poderlos dar de alta en The Data Hub proporciona una cierta melancolía, envidia incluso, de no haber contado como una guía como esta que tanto nos habría ayudado en un momento en que la modificación general de la tecnología y de las estructuras de la información era difícil. Desde luego, quienes vayan a emprender a partir de ahora este camino, les resultará enormemente práctico.

Un cuarto capítulo está dedicado a los pasos que deben darse, una vez que se han establecido los procedimientos para la publicación de los datos en LOD. Se enumeran opciones de implementación, se explica cómo deben publicarse y utilizarse los datos vinculados y dónde se encuentran los conjuntos de datos y vocabularios de valores en Linked Data, superados ya los dos documentos que se publicaron conjuntamente con el informe final en la ya citada fecha de 25 octubre de 2011. El tono manifiestamente favorable de esta reseña no está basado desde luego en el hecho de que el autor de la misma figure entre los agradecimientos, pero sí la lista de los allí mencionados supone una buena pista para buscar referencias bibliográficas de autores que han trabajado sobre estos aspectos o dirigen proyectos con estas características.

El informe se cierra con una serie de apéndices que recorren la historia del propio documento, explican de manera muy clara la terminología y recogen los estándares de metadatos utilizados en el informe. En mi opinión el apéndice con el que se cierra el documento es especialmente útil porque establece un crosswalk entre los metadatos utilizados en LODE-BD y en schema.org. Quizá no esté de más recordar que schema.org es el punto de encuentro y de acuerdo al que han llegado los grandes buscadores Google, Bing y Yahoo y cuya implementación en la interfaz de recuperación de cualquier sistema automatizado es beneficiadísima.

En resumen, un auténtico vademecum caracterizado por su enfoque eminentemente práctico, sin que por ello en ningún momento se pierda el necesario rigor ni se abandone el propósito de una exhaustividad que verdaderamente resulta admirable si se tiene presente que el documento tiene 52 páginas.

Muy útil.