Descriptive Metadata for Web Archiving: un esquema de metadatos de OCLC para la descripción de webs archivadas

Versión para impresiónVersión para impresión

Andreu Sulé
Facultat de Biblioteconomia i Documentació
Universitat de Barcelona


Dooley, Jackie; Bowers, Kate (2017). Descriptive Metadata for Web Archiving: recommendations of the OCLC Research Library Partnership Web Archiving Metadata Working Group. Dublin, Ohio: OCLC. 53 p. Disponible en: <https://www.oclc.org/research/publications/2018/oclcresearch-descriptive... [Consulta: 19/05/2018].


El control bibliográfico universal ha sido, desde hace más de dos siglos, un objetivo fundamental de la comunidad bibliotecaria. Paul Otlet y Henri La Fontaine, a principios del siglo XX, con su Répertoire bibliographique universel, ya quisieron describir toda la documentación del mundo mediante fichas móviles. Y si ya en el tiempo de Otlet y La Fontaine este objetivo era difícil de conseguir, con la explosión de la producción documental en la segunda mitad del siglo XX dicho propósito se convirtió casi en imposible. Después de la II Guerra Mundial el número de publicaciones aumentó exponencialmente y, además, se presentó en formatos muy diversos.

El golpe de gracia en esta carrera inalcanzable por el control bibliográfico universal fue la aparición de Internet, que con sus facilidades de publicación pusieron al alcance de cualquier persona e institución la creación de contenidos. Además, este nuevo contenido web tiene una de las características más perniciosas para el control bibliográfico: su volatilidad. En efecto, si hasta entonces las publicaciones, a pesar de su gran volumen, eran materiales relativamente estables y de contenido inalterable, con el web todo resulta inestable. Se crean páginas web de las cuales algunas desaparecen en cuestión de semanas o meses, y la gran mayoría actualizan  su contenido con una frecuencia tal que, parafraseando Heráclito de Éfeso, «un hombre no puede bañarse dos veces en la misma web».

La comunidad archivística ha sido otro de los sectores damnificados por este cambio en el volumen y la naturaleza de la información con la irrupción del web. A pesar de tener un enfoque de la descripción diferente al de la comunidad bibliotecaria (agrupaciones de documentos en lugar de recursos individuales; acento en el contexto más que en la descripción; etc.), la variabilidad de las páginas web ha dificultado la tarea para la elaboración de descripciones archivísticas esmeradas.

A lo largo de los últimos años, diversos han sido los intentos de elaborar unos criterios de representación de los contenidos web que diesen respuesta a los retos mencionados. Algunos han sido diseñados dentro de un marco más amplio de descripción, como es el caso de los «recursos integrantes» de Resource Description and Access, o Describing archives: a content standard en el contexto de la archivística, mientras que otras organizaciones, como el PADICAT, han aprovechado esquemas de metadatos genéricos como Dublin Core para elaborar perfiles de aplicación específicos para la descripción de las páginas web archivadas.

Ahora, en 2018, es OCLC quien presenta su propuesta de esquema de metadatos para la descripción de webs archivadas, el Descriptive Metadata for Web Archiving. Se trata de una recomendación muy poco granulada, con tan solo 14 propiedades, 8 de las cuales son elementos de Dublin Core Metadata Element Set.

Collector     Extent     Source of description
Contributor     Genre/Form Subject
Creator     Language     Title
Date     Relation     URL
Description     Rights      

Las autoras de la propuesta, Jackie Dooley y Kate Bowers, ponen especial énfasis en el hecho que Descriptive Metadata for Web Archiving quiere resultar «un puente entre los enfoques bibliográficos y archivísticos de la descripción» (p. 5). De hecho, la propuesta trata de superar esta dualidad con una metodología de elaboración plenamente orientada al usuario, basada en el informe Literature review of user needs, también de OCLC. En este interesantísimo documento, poco frecuente en proyectos de este tipo, se analizan las necesidades de dos tipos de usuarios de metadatos: los usuarios finales y los profesionales de metadatos. La revisión bibliográfica concluye cosas tan significativas como que para los usuarios finales es importante disponer de información contextual de la procedencia de las páginas web archivadas, o como que para los profesionales es bastante importante encontrar formas de combinar las normas bibliotecarias y las prácticas archivísticas.

Otra idea fuerte de Descriptive Metadata for Web Archiving es la voluntad de ser un esquema compatible con el resto de esquemas ya existentes, generalmente más granulados. De esta manera se pretende «mejorar la compatibilidad y fomentar la consistencia entre entornos de descubrimiento» (p. 16). En este sentido, la propuesta de OCLC parece pretender ir un paso más allá del actual uso de Dublin Core Metadata Element Set como «máximo común divisor» de la interoperabilidad, agregando elementos propios de la comunidad archivística como el contexto de procedencia y la descripción a nivel de colección.

Para finalizar, destacar el acierto de dedicar buena parte de la propuesta a sus fundamentos teóricos y metodológicos. Casi un tercio del total de las 53 páginas que ocupa el documento está dedicado a exponer y explicar los objetivos, las prácticas descriptivas y los estándares ya existentes, los estudios previos hechos por el propio OCLC (el ya mencionado Literature review of user needs y Review of harvesting tools, una revisión de herramientas de recolección web), y un apartado muy interesante sobre diversos problemas sin resolver todavía que deberán ser motivo de investigación en un futuro.

Tendrá que verse qué grado de aceptación y de implementación real tendrá Descriptive Metadata for Web Archiving, dado que su simplicidad puede ser, al mismo tiempo, su punto fuerte y débil. Punto fuerte porque da una respuesta mixta, escalable y económica a un problema compartido por bibliotecas y archivos; punto débil porque esta misma simplicidad puede hacer la propuesta poco atractiva para instituciones y servicios con proyectos de gran complejidad funcional.