Amadeu Pons
Facultat de Biblioteconomia i Documentació
Universitat de Barcelona
ÍnDICEs CSIC (2018). Madrid: CSIC. Centro de Ciencias Humanas y Sociales. Es continuación de Bases de datos bibliográficas del CSIC. Disponible en: <https://indices.csic.es/>. [Consulta: 6/01/2019].
Presentación
A diferencia de la mayoría de entradas de este blog, no será esta la reseña de un informe reciente de interés para bibliotecarios, sino el análisis de una base de datos bibliográfica. Concretamente, un recurso que nos permite conocer la producción científica española de artículos de revista. El motivo que hace que la reseñemos ahora es que, aunque esta base de datos existe desde hace muchos años, fragmentada en tres bloques, en julio de 2018 se reunificó y cambió de nombre: ÍnDICEs CSIC.
Autoría
La entidad productora es el Centro de Ciencias Humanas y Sociales (CCHS), que pertenece al CSIC (Consejo Superior de Investigaciones Científicas). Esta unidad fue creada en 2007 a partir de la agrupación de diversos órganos de investigación del propio Consejo del ámbito de las humanidades y las ciencias sociales. Uno de estos órganos era el Instituto de Estudios Documentales sobre Ciencia y Tecnología (IEDCYT), que era el sustituto del CINDOC (Centro de Información y Documentación Científica), el cual, a su vez, era fruto de la reunificación, en 1992, de dos centros creados en 1975: el ICYT (Instituto de Información y Documentación en Ciencia y Tecnología) y el ISOC (Instituto de Información y Documentación en Ciencias Sociales y Humanidades). Todas estas entidades han estado implicadas en la elaboración de esta base de datos a lo largo de los años.
Alcance temático y geográfico
El alcance temático de la base de datos es multidisciplinar: se analizan revistas de tipo científico de todos los campos del conocimiento. Las revistas deben estar publicadas en España. Los criterios para considerar una revista como científica y, por tanto, candidata a ser indexada por esta base de datos, son los de Latindex: es necesario que la revista conste en el «Catálogo» de Latindex.1
Como decíamos, este recurso bibliográfico no es nuevo, se basa en la refundición de tres bases de datos que existían desde la década de los setenta y que eran conocidas, hasta ahora, con el nombre de Bases de datos del CSIC.2 Hasta que no se ha producido la unificación, se consultaban de manera independiente: ICYT (de ciencia y técnica, creada en 1979), IME (medicina, de 1971) e ISOC (ciencias sociales y humanidades, de 1975). ICYT e ISOC se producían en Madrid, por el CINDOC, e IME se elaboraba en Valencia por otro órgano del CSIC: el Institut d’Història de la Ciència y Documentació López Piñero, que tenía como antecedente el Institut d'Història de la Medicina. Después de diversas transformaciones, este centro se llama desde 2008 Institut Interuniversitari López Piñero, y ya no elabora la bibliografía de ciencias de la salud.
Alcance cronológico
El alcance cronológico de la base de datos es difícil de precisar con exactitud, dado que el documento más antiguo que se encuentra data de 1916, y hasta 1939 se encuentran algunos más, muy pocos (48 en total); de la década de 1940 a 1950 ya encontramos 407. Es a partir de 1971 que las cifras ya aumentan significativamente.
Cantidad de datos
Según las estadísticas proporcionadas por la propia base de datos, el número total de revistas vaciadas es de 4.165 (de las cuales están vivas actualmente 2.282, el 55 %), y el conjunto de artículos referenciados está a punto de llegar a 1,3 millones.3 Por lo que se refiere a las materias de las revistas, la mayor parte corresponde a las ciencias sociales (37 %), seguidas por las humanidades (con el 27 % de los títulos), las ciencias y tecnologías (16 %), la medicina (11 %) y las revistas multidisciplinarias (9 %). También disponemos de cifras sobre la distribución de los títulos por lugar de publicación (por comunidades autónomas). Madrid encabeza de largo este ranking, con 1.594 títulos (38 %), seguido por Cataluña, con menos de la mitad, 705 (17 %) y Andalucía, con 437 títulos (10 %).
Del total de artículos recogidos, el 29 % están disponibles en línea (enlazados desde su registro) y el 37 % de los registros incluyen el resumen publicado por la revista original. En cuanto a los idiomas de los trabajos incluidos, en catalán se encuentran cerca de 36.000 (el 3 %), en gallego, pocos más de 6.200 (0,5 %), y en vasco, únicamente 10.
Es importante tener en cuenta que no todas las revistas están vaciadas exhaustivamente: la política de cobertura varía entre «prioritaria», «seleccionada no prioritaria», «actualización parcial» y «no se actualiza»; pero por ahora no se encuentran explicaciones sobre el alcance de estas expresiones ni los criterios con que se aplican a cada revista. A modo de ejemplo, la revista Item figura como que «no se actualiza» (se encuentran 8 artículos de 2018 y 22 de 2017; pero ninguno de 2015 ni de 2016), BiD aparece como «seleccionada no prioritaria». Del ámbito de la información y la documentación, solo hay cinco títulos cuya la cobertura es «prioritaria»: Boletín de la Asociación Andaluza de Bibliotecarios, Documentación de las ciencias de la información, El profesional de la información, Revista española de documentación científica y Revista general de información y documentación.
Los datos de los artículos pueden ser incorporados directamente por los editores de las revistas, mediante el envío de ficheros XML con los metadatos del esquema Dublin Core. El personal del CSIC valida los datos y añade la indexación por materias «conforme a un lenguaje documental especializado y normalizado».
Acceso
La interfaz se presenta en español e inglés. Existen dos modalidades de acceso a la base de datos: gratuita y por subscripción. Esta última, disponible para todas las bibliotecas universitarias públicas catalanas. Los usuarios de estas universidades pueden registrarse gratuitamente y guardar estrategias de búsqueda realizada y resultados, así como recibir alertas mensuales con nuevos artículos incluidos de las materias previamente seleccionadas.
Datos de los registros
Un ejemplo de registro completo puede verse en el ejemplo siguiente:
Como puede verse en la imagen, los autores y las materias son enlaces activos que pueden generar nuevas búsquedas.
Opciones de búsqueda
En la versión gratuita tan solo es posible buscar por autor, título del artículo, título de la revista y año de publicación. En cambio, en la modalidad de pago, hay cuatro modalidades de búsqueda: la búsqueda simple (que recupera texto de los campos de materia, título del documento y resúmenes; pero no de autores ni títulos de las revistas), la búsqueda avanzada (que permite limitar las búsquedas en cualquier campo de los registros y combinarlas con los operadores booleanos), la búsqueda experta (que permite construir una estrategia de acuerdo con una sintaxis determinada) y la búsqueda por índices (que permite seleccionar los términos de cuatro índices: materias, descriptores, identificadores y topónimos).
Hay que decir que, en esta última modalidad hay un poco de confusión, dado que en el campo de materias se han incluido los términos de otros campos de las bases de datos anteriores (topónimos, identificadores y descriptores); asimismo, los otros tres índices sí que responden a su nombre. Por lo que se refiere en concreto a las materias, hay que tener en cuenta que ÍnDICEs CSIC es la suma de tres bases de datos que hasta entonces eran independientes, y por ello pueden encontrarse incoherencias. Actualmente, se está trabajando por la unificación de criterios en la indexación y la eliminación de errores.
Dos funciones a valorar del motor de búsqueda: la búsqueda se realiza truncando por la raíz de las palabras, lo que amplía los resultados previstos (por ejemplo, si en las materias pedimos «independentismo», recuperamos también «independencia», «independiente»...). Además, en determinados campos de la búsqueda avanzada, el sistema sugiere los términos de búsqueda disponibles en los índices o bien ofrece la lista de los valores existentes, lo que facilita la elección. Por otra parte, en el índice de topónimos, los nombres que cuentan con diferentes formas (Terrassa-Tarrasa, London-Londres...) se encuentran unificados, se llega a la misma respuesta interrogando desde cualquier variante.
Lamentablemente, no está disponible el lenguaje documental utilizado para indexar por materias las entradas. Otro punto mejorable es la falta de unificación de los nombres de los autores, como puede verse en la ilustración siguiente, con dos entradas diferentes para Mònica Baró y para Joan Baró:
Así, para encontrar los 22 artículos de Mònica Baró que constan en la base de datos, hay que realizar tres búsquedas diferentes (porque también aparece en minúsculas, forma que da otros resultados).
Visualización y gestión de resultados
El sistema permite ordenar las respuestas por diferentes criterios y filtrar los resultados por 13 facetas diferentes. En caso de estar registrado, los resultados y las búsquedas pueden guardarse para una consulta posterior, y los resultados obtenidos pueden exportarse con diversos formatos.
Actualización de los datos
La actualización de la base de datos es diaria; pero los datos que se entran parece que no son recientes. Véase el cuadro siguiente, de los documentos existentes por año de publicación:
Si hasta los primeros años de la década de los 2010 la cantidad anual de entradas ronda las 30.000, no parece lógico que en 2016 baje a menos de la mitad...4 Por otra parte, el centro valenciano que se encargaba del antiguo IME dejó de hacer este trabajo en 2012.
Comentarios finales
¿Qué nos aporta ÍnDICEs CSIC en comparación con RACO (el repositorio de revistas vivas publicadas en Cataluña)?5 En cifras absolutas, RACO contiene 500 títulos,6 mientras que ÍnDICEs CSIC incluye 705 revistas publicadas en Cataluña (de las cuales, 358 vivas).
Comparemos, a modo de ejemplo, las dos bases de datos, las revistas cuyo título empieza por D, publicadas en Cataluña y que todavía están vivas. Entre las dos fuentes, se localizan 19 en total. De estas, hay ocho (42 %) que únicamente aparecen en RACO: Dante e l’Arte, Datatèxtil, Didacticae, Doblele, Documentos de la Escuela de Ingenieros Industriales de Barcelona, Dossiers feministes, Dovella y Drassana. En cambio, hay dos revistas (11 %) que únicamente aparecen en ÍnDICEs CSIC: Dictatorships and democracies y Dolor. El resto (nueve, 47 %) aparecen en las dos plataformas.
¿Qué nos aporta ÍnDICEs CSIC ante Dialnet? (base de datos multidisciplinaria, de alcance internacional, con unas 10.400 revistas vaciadas). Haremos una comparación rápida y solo indicativa entre las revistas de química publicadas en España que se encuentran en las dos fuentes. En total se identifican 33 títulos. De estos, tres (9 %) se encuentran únicamente en Dialnet (Gemología & ciencia, Interempresas: industria química y MoleQla). En cambio, hay 11 títulos (33 %) que aparecen únicamente en ÍnDICEs CSIC: Acta química compostelana, Anales de química (cuatro títulos), Folia chimica theoretica latina, Instituto Químico de Sarriá, Química analítica, Química hoy, Reunión bienal (Real Sociedad Española de Química) y Studia chemica. 19 títulos (58 %) aparecen en las dos fuentes.
Por lo que se refiere a la actualización del vaciado de estas revistas de química, mientras que Dialnet se presenta bastante al día, en ÍnDICEs CSIC se para el análisis hace años en los títulos siguientes, que continúan apareciendo a día de hoy: Afinidad, en 2012; Anales de la Real Sociedad Española de Química, en 2014; Cromatografía, en 2015.
¿Qué nos aporta ÍnDICEs CSIC ante IBECS? (el Índice bibliográfico español en ciencias de la salud, elaborado por el Instituto de Salud Carlos III). Mientras en IBECS se vacían 432 revistas españolas de las ciencias de la salud, en ÍnDICEs CSIC hay 472. Si bien el número de títulos en esta última fuente es superior, la actualización deja mucho que desear. A modo de ejemplo, con la materia «oncología» encontramos en ÍnDICEs CSIC 4, 8 y 10 artículos, publicados respectivamente en 2014, 2015 y 2016; pero ningún artículo de 2017 o 2018. En cambio, en la base de datos especializada, encontramos, con el mismo término de búsqueda, 6, 7 y 10 artículos publicados los años 2014-2016; pero 12 para el 2017 y 11 para el 2018.
Conclusión
ÍnDICEs CSIC tiene unos puntos fuertes: la cantidad de revistas españolas vaciadas, la antigüedad de la información disponible y la potencia de su motor de búsqueda. Pero tiene diversos puntos débiles: la falta de actualización del vaciado, la falta de exhaustividad en el análisis de las revistas y las disfunciones en la recuperación de la información a partir de las materias.
Ojalá que el CSIC se esfuerce por mejorar el producto para que sea realmente un recurso de interés para estudiosos de todos los campos.
1 Para el detalle de estos criterios cualitativos, puede verse: http://www.latindex.org/latindex/meto2
2 Antes de la aparición de los CD-ROM i de Internet, se publicaban en papel. Los interesados en la arqueología bibliográfica pueden consultar: Villa Sanz, María de la. «Descripción de dos repertorios bibliográficos: el Índice español de ciencias sociales y el Índice español de humanidades». Boletín de la ANABAD, tomo 29, n.º 4 (1979), p. 51-57. Disponible en línea en: https://dialnet.unirioja.es/servlet/articulo?codigo=967409.
3 Escasamente hay introducidas monografías: apenas unas 9.000, entre libros, informes y tesis.
4 Esta consulta se hizo el 5 de enero de 2019.
5 Véase una reseña sobre RACO en Blok de BiD.
6 Hay que decir que no todas las 500 revistas están vivas actualmente: algunas han dejado de publicarse.