Preservación de ebooks, nuevo reto para las bibliotecas y centros de documentación

Versión para impresiónVersión para impresión
Lluís Vicente
Director de la Biblioteca i Arxiu històric
Ateneu Barcelonès

Amy Kirchhoff and Sheila Morrissey (2014). Preserving ebooks. Digital Preservation Coalition. Disponible a: http://dx.doi.org/10.7207/twr14-01 [Consulta: 13/07/2015]

El uso de eBooks y los servicios derivados para bibliotecas y centros de documentación ha sido uno de los grandes retos del sector en los últimos tiempos. Cómo acceden los usuarios, cuál es la forma y condiciones de adquisición o cuáles deben ser los dispositivos de lectura son cuestiones trabajadas y tratadas por profesionales de todo el mundo. En este sentido, también se han de tratar las cuestiones relacionadas con la preservación digital, la cual debe permitir el acceso y el uso en el futuro de este nuevo tipo "de artefacto libro". El estudio Preserving eBooks de Amy Kirchhof y Sheila Morrissey -dentro del marco del análisis que hace la Digital Preservation Coalition en varios campos- plantea cuáles son los principales problemas y modelos seguidos en materia de preservación digital de libro electrónico. Los objetivos del estudio son identificar los riesgos generados y asegurar la accesibilidad en el futuro, trabajando aspectos como la integridad, el contexto, la procedencia y la identificación de los datos. En definitiva, como construir el patrimonio digital de bibliotecas y centros de documentación.

En primer lugar, encontramos las variaciones del modelo de negocio aplicado por editoriales o distribuidoras. A partir de los ejemplos expuestos en el estudio: no se vende un producto, sino un servicio, una licencia que da acceso al producto. No hay una propiedad, hay unas condiciones de acceso y uso. En estas condiciones no se recoge generalmente la garantía de preservación a repositorios corporativos de la institución que adquiere eBooks. Es un cambio, pero no el único respecto del modelo analógico de adquisición de libros. Por ejemplo, la caducidad de uso relacionada con la superación de un cierto número de préstamos o la caducidad marcada por una temporalidad acordada ... Si la licencia es efímera, ¿no se puede garantizar el uso a largo plazo o preservar su contenido? Para dar respuesta a esta cuestión, el estudio nos habla del mercado que suponen las bibliotecas universitarias o de otros tipos de centros de investigación para el sector editorial. Como modelo encontramos las instituciones de investigación estadounidenses, las cuales han logrado eliminar o minimizar los efectos de la caducidad, haciendo valer esta fuerza de compra. En el futuro, las nuevas condiciones deberían incluir acuerdos favorables en preservación de los eBooks. A este hecho, hay que sumar la preservación de libros electrónicos creados en plataformas de autopublicación.

En segundo lugar, el eBook cuenta con una multiplicidad de opciones de enriquecimiento y actualización de contenidos que da un dinamismo que puede llegar a dificultar la preservación del nuevo formato. Por un lado, un libro electrónico puede contar con incrustaciones de contenidos tipo vídeo o audio y también enlaces a otros contenidos en la red. ¿Como asegurar el acceso a esta información, complementaria o no, que se encuentra dentro del objeto digital? ¿El editor tiene todos los derechos sobre esos contenidos incrustados? Por el otro lado, un editor o proveedor puede actualizar el contenido de un libro electrónico de manera regular. ¿Qué versión es la que se debería preservar? ¿Como se registrarán estas actualizaciones? En ambos casos, nos encontramos con el riesgo de la dificultad de garantizar la integridad y la estabilidad de la información de cada ejemplar y la pérdida de información.

Estos no son los únicos aspectos conflictivos, hay más:

  • La encriptación DRM de los eBooks, que sirve para restringir el uso y explotación del eBook, puede complicar futuras migraciones de formato o recuperación de bits perdidos en un futuro -habitualmente es tecnología propietaria y no tiene porqué pertenecer a la editor o distribuidor.
  • Las normativas legales en varios países pueden no asegurar el depósito legal de la publicación electrónica.
  • En menor medida, el paso de lo analógico a digital. Es decir, la digitalización de libros en dominio público, que si bien puede conllevar menos dificultades, es una creación de eBooks masiva y en algunos casos es compartida entre instituciones públicas y empresas privadas que no tienen entre sus objetivos la preservación digital (Google o Proquest).

El estudio también habla de formatos, metadatos y sistemas reales de preservación de eBooks. En referencia a los formatos -Estándares de facto para la adopción de la industria-, encontramos los que mantienen el contenido fijo, copiando el modelo analógico. PDF es el máximo exponente y se desaconseja el uso del formato, ya que no hay validadores, tipo DROID o JHOVE, que la analicen totalmente. También existen los formatos que permiten cambios, aportando las opciones de actualización comentadas con anterioridad. Son XHTML, XML y EPUB -se trata del formato propuesto por el International Digital Publishing Forum. Destaca el último, por su estructura y por ser de código abierto. Estos formatos facilitarían la futura preservación.

En referencia a los metadatos, hay dos alternativas. Por un lado, el MARC como sistema ideal para bibliotecas y centros de documentación. Por otro, el ONIX, empleado para editores y proveedores. La calidad del primero no siempre es aplicada a la catalogación que hace la industria, la cual se decanta por el segundo, ya que incluye más metadatos relacionados con la distribución comercial del eBook. Dentro de los aspectos ligados a los metadatos, hay varias alternativas para obtener un identificador único del objeto digital. El más extendido es el DOI y como alternativa está el ISTC. El principal problema, en referencia al identificador único, son las diversas versiones que puede haber de un libro electrónico, y ambos sistemas parecen solucionarlo.

Como casos que deben servir de ejemplo para el resto de instituciones destacamos:

  • La Biblioteca Nacional de Holanda (KB) tiene un proyecto de preservación de libros electrónicos centrado en la voluntariedad de la ingesta por parte de editores o proveedores, los cuales tienen todos los derechos de las incrustaciones del libro, y además aportan versiones sin DRM. Los documentos pueden ser accesibles por los usuarios o pueden estar embargados. En cuanto a los metadatos utiliza el esquema METs, junto con Dublin Core y PREMIS y además de incorporar un identificador único propio, permite que el editor-distribuidor aporte el ISBN y el DOI del libro. Dentro del ámbito de las bibliotecas nacionales, también se habla del modelo de la Biblioteca del Congreso, el cual se encuentra en una fase menos avanzada que el sistema de los Países Bajos.
  • HaitiTrust es un consorcio de varias instituciones de investigación y sus bibliotecas. Una de las misiones es la preservación de todo tipo de contenidos digitales, que se encuentren entre su red de consorciados y fuera de ella - incluyendo contenidos que se encuentren en Google, Microsoft o el Internet Archive. Su proyecto de preservación utiliza MARC. El principal reto de HaitiTrust es dar acceso a documentos que en su mayoría, hasta un 70% contienen derechos de autor.
  • El último caso reseñado es el de Portico, plataforma de preservación de ITHAKA. De nuevo, se trata de una plataforma donde los editores, de manera voluntaria, pueden ingestar sus libros. Piden a los editores que clarifiquen todos los derechos de los contenidos incrustados, eliminen las encriptaciones de DRM y mantienen documentos sin publicar. Sólo dan acceso en caso de que descatalogación del editor, que este no continúe con su actividad o finalización de un período de embargo.

Finalmente, entre las recomendaciones realizadas por el estudio nos encontramos con dos líneas: una para los editores y proveedores, y la otra para las bibliotecas o instituciones de investigación o memoria que deben preservar este nuevo formato de libro. Los primeros, deben tener derechos de los contenidos incrustados, hacer actualizaciones con protocolos que permitan a las bibliotecas guardar las versiones anteriores en repositorios que no den acceso público- siempre que se considere necesario-, utilizar estándares, tanto en cuanto a formatos, como con respecto a los metadatos. Los segundos deben llegar a acuerdos de adquisición de licencias que incluyan la accesibilidad a largo plazo, la eliminación de DRM y la participación de editores y distribuidores en las políticas de preservación. También asumir el eBook dentro de las políticas de preservación, trabajar de manera consorciada con otros centros similares. En resumen, nos encontramos ante la importante heterogeneidad en formatos, licencias, tecnologías, procesos de ingesta, la única manera de hacer sostenible el sistema es con el compromiso de ambas partes se podrá crear un sistema de preservación sostenible que permita la acceso a este patrimonio nacido digital.