Europeana en fase Danubio

Versión para impresiónVersión para impresión
 
Xavier Agenjo Bullón
Cuerpo Facultativo de Archiveros, Bibliotecarios y Arqueólogos
Director de Proyectos de la Fundación Ignacio Larramendi
 

Ruth Bloomberg, Makx Dekkers, Stefan Gradmann, Mats Lindquist, Carlo Meghini, Julie Verleyen (2010). Functional specification for the Europeana Danube release. Europeana Think Culture. <http://version1.europeana.eu/c/document_library/get_file?uuid=42fdf604-8bd7-4fe4-8d3e-36cce6fcad65&groupId=10602> [Consulta: 25/01/2012]

 

No es necesario insistir en que Europeana es ahora un proyecto perfectamente integrado en la Agenda Digital Europea (Diario Oficial de la Unión Europea del 26 de agosto de 2010). Esta Agenda Digital Europea ya fue objeto de una acertada reseña en este mismo "Blok de BiD" a cargo de Ernest Abadal. Aunque se concretó en el segundo semestre de 2010, la Agenda Digital había sido elaborada durante la presidencia española en el primer semestre de ese mismo año. Una de las características fundamentales del proyecto Europeana es que dispone de un modelo de datos específico, Europeana Data Model (EDM). Gracias a este modelo y a las especificaciones funcionales (30 de agosto de 2010) se inició el 1 de mayo de 2011 la denominada Fase Danubio en la que actualmente nos encontramos.

Tres importantes documentos vieron la luz en el primer semestre de 2011: el denominado informe del Comité des Sages, titulado The New Renaissance, el Plan Estratégico 2011-2015 y el Plan de Negocio correspondiente al año en curso. Igual de importante ha sido la puesta en funcionamiento de los diferentes Core Groups, elementos constitutivos fundamentales del Council of Content Providers and Aggregators (CCPA). Si hago referencia al CCPA es para instar, una vez más, desde esta privilegiada tribuna a que todos los proveedores de datos españoles, en torno a una treintena, se den de alta en uno o varios de los cinco grupos de trabajo, al menos en el denominado Reflection Group, o preferiblemente en los Core Groups, donde se lleva a cabo trabajo efectivo y se toman las decisiones. El 22 de septiembre se hizo oficial el Europeana Data Exchange Agreement que, entre otras muchas cosas, aboga decididamente por el Creative Commons Universal Public Domain Dedication, y, lo que es más importante, incluye la autorización para la reutilización de los contenidos agregados por Europeana a cargo de terceras partes. El 6 de diciembre pasado tuvo lugar en Rotterdam el CCPA Annual General Meeting donde se tomaron importantes decisiones acerca de la estructura organizativa. Estos aspectos organizativos y políticos tienen siempre un fundamental correlato, el presupuesto.

EDM está constituido por la reutilización de namespaces como RDF, RDFS, OAI-ORE, SKOS y DCMI Terms. El denominado Ingestion Team que dirige Antoine Isaac, sumamente activo así mismo en el W3C Library Linked Data Incubator Group, ha elaborado unas especificaciones para el denominado CHO (siglas de Cultural Heritage Object) que es la estructura central que los distintos proveedores y agregadores de datos deben enviar la información a Europeana, probablemente utilizando mecanismos de recolección basados en el protocolo OAI-PMH, o tal vez como se ha apuntado en algún foro, ampliando determinados verbos de HTTP, del cual PMH es obviamente un subconjunto. Yo mismo he propuesto en las reuniones del Technical Group que para ello se utilizase METS, basándome en la experiencia que DIGIBÍS posee a partir de múltiples proyectos de digitalización para la gran mayoría de los proveedores de datos españoles de Europeana, así como para el propio Ministerio de Cultura que agrega, mediante Hispana, a más del 96% de los objetos digitales que proporciona España y que es en este momento el cuarto proveedor de datos al gran proyecto de la Unión. Esta opinión mía también está basada en una recomendación de la Digital Library Federation que se encuentra con problemas análogos en los Estados Unidos.

Se ha dicho en más de un documento que el Europeana Data Model es un sabor de Linked Open Data y no deja de ser significativo que en junio de 2011 apareciera ya un proyecto piloto Europeana Linked Open Data con más 3,5 millones de registros. Como si se hubiera tratado de un pistoletazo de salida, en muy pocos meses han aparecido en Linked Open Data los datos de SUDOC, la Red de Bibliotecas Universitarias Francesas, de la British Library y de la National Library Diet de Japón, que aunque no está relacionado con el proyecto Europeana es muy significativo. Mucho más importante desde el punto de vista español es la publicación de la Lista de Encabezamientos de Materia para Bibliotecas Públicas que establece un closeMatch con los LCSH y recientemente con RAMEAU y los Schalgwortnormendatei. Entre lo más sonado se encuentra la publicación, comunicada con su sobriedad habitual por Sally McCallum, del LC Names Authority File al que ha añadido el set de subencabezamientos de forma y de género, no sólo en SKOS sino también MADS/RDF.

No deja de ser curioso que en el I Seminario Internacional de Bibliotecas Dixitais intervinieran tanto Sally McCallum como Stefan Grandman y quien escribe esta reseña, que presento la Biblioteca Virtual Larramendi conocida como Polymath Virtual Library en los use cases del W3C LLD, mostrando el desarrollo que había realizado DIGIBÍS para exportar conforme a EDM los registros de la citada biblioteca. Posteriormente, la Biblioteca Virtual de Patrimonio Bibliográfico también incorporó esa funcionalidad y ambas bibliotecas han sido recolectadas por Hispana, dónde puede verse con claridad, la estructura EDM de la que se está hablando. Muy significativo ha sido, así mismo, la Orden Ministerial de 2011 por la que se convocan ayudas para la creación de repositorios digitales conforme a EDM y que permitirá que el año próximo varios centenares de miles de registros, incluso más de un millón, adopten esta estructura.

Gracias a la adopción del Europeana Data Model las bibliotecas europeas y españolas se incorporarán claramente a movimiento Linked Open Data que se está extendiendo mundialmente y que, no lo olvidemos, gracias al precepto del sameAs permitirá vincular, agregar, reutilizar y enriquecer los nombres de persona e institución y los encabezamientos de materia en las cinco lenguas más utilizadas en occidente y que coinciden con las principales áreas de edición del mundo, el inglés, el alemán, el español y el francés.

El Europeana Data Model se ha visto consolidado con la edición de una serie de documentos. Estos documentos son: el Europeana Data Model Primer, que solventa desde un punto de vista práctico la implementación del Europeana Data Model en su versión 5.2.2 y que actúa claramente a modo de directriz. Apareció el 26 de octubre de 2011. Al día siguiente se publicó el Europeana Data Model Mapping Guidelines en el que se describen minuciosamente los mapeos para transformar el Europeana Semantic Elements a las clases, tanto básicas como contextuales, y propiedades de EDM. Puede decirse que si bien estas directrices no suprimen al Europeana Semantic Elements –que seguirá siendo aceptado durante algún tiempo– sí dejan claramente de manifiesto lo insuficiente que éste resulta para un entorno Linked Open Data o, por decirlo en europeo, en EDM. Estas directrices van acompañadas de dos apéndices, uno el que se refiere al mapeo a EDM desde datos en formato LIDO, el esquema de metadatos básico que se utiliza para recolectar objetos digitales en el mundo museológico, así como una presentación de los datos en EDM después de la conversión de datos.

El mismo día 27 de octubre apareció publicado el resumen Europeana Data Model Fact Sheet dirigido a los denominados policy makers y a quiénes deben de tomar decisiones basándose en premisas técnicas. Efectivamente, en el documento se expresa de forma admirablemente sintética el objetivo Europeana y la solución que no es otra, como puede figurarse el lector, que EDM. También de forma muy breve se describe cómo se pueden enriquecer los datos mediante la reutilización de otros procedentes de terceras fuentes y se señala, como es lógico, el ejemplo de la DBpedia que por alguna razón figura en el centro del famoso diagrama en forma de nube de LOD. Queda claro, también en ese documento cómo contribuye EDM a la Web de los datos o Web Semántica y el modo que se recomienda para la implementación de EDM.

A esa concatenación de sucesos hay que añadir que el día 25 de octubre se publicó el Informe Final del World Wide Web Consortium Library Linked Data Incubator Group, dividido para facilitar su manejo en tres documentos titulados respectivamente: Final Report, el informe sobre Use Cases y el informe sobre Datasets, Value Vocabularies, and Metadata Element Sets. Desde el punto de vista español no deja de ser muy llamativo que la Polymath Virtual Library figure como uno de los casos de estudio y que haya utilizado los procedimientos para enriquecer los datos recomendados por Europeana, tales como la DBpedia o VIAF en su proyecto Biblioteca Virtual de la Escuela de Salamanca, en la que también se utilizan, como es lógico, el MARC 21 y las RDA tal y como estas van siendo codificadas en las sucesivas versiones del formato MARC 21.

En esos mismos días, el 21 de octubre, tuvo lugar un acontecimiento fundamental anunciado en la Europeana Tech Conference de Viena, el acuerdo de cooperación entre la Digital Public Library of América y Europeana. Conviene mencionar el uso de la herramienta MINT para asegurar la interoperabilidad de los metadatos y desarrollado, al contrario de lo que suele ser lo habitual, en Europa para ser utilizada en los Estados Unidos.

Por último, el 31 de octubre Europeana publicó un último documento de una importancia excepcional, me refiero al Final Technical and Logical Architecture and Future Work Recommendation que despeja por completo el panorama de cómo ha de construirse Europeana a medio plazo. Es el último entregable de Europeana version1 cuyo recorrido ha terminado y que será sustituido por Europeana version2 (2011-2014) que entró en funcionamiento en el mismo mes de octubre.

De esta manera, Europeana ha cubierto su primer año conforme a su Plan Estratégico y a su Modelo de Negocio, habiendo perfilado extraordinariamente sus especificaciones funcionales, su modelo de datos y sus estándares que no son otros que los de Linked Open Data, al mismo tiempo que supera los 20 millones de objetos digitales, a los que hay que añadir el extraordinariamente importante Europeana Data Exchange Agreement y que convierte a los objetos culturales digitales en sujetos al CCO 1.0 Universal Public Domain Dedication.

Sin duda un gran año para Europeana, para quienes trabajamos en ella y para las bibliotecas, archivos y museos en general.