Director de Projectes de la Fundación Ignacio Larramendi
Carol Carol Jean Godby and Ray Denenberg (2015). Compatibilities Between the Linked Data Models of the Library of Congress and OCLC. Disponible en http://www.oclc.org/research/publications/2015/oclcresearch-loc-linked-data-2015.html
Amb la publicació el 2011 de l'Informe Final del W3C Library Linked Data Incubator Group (disponible en Traducció a l'espanyol de Documents del W3C Library Linked Data Incubator Group) [1] es va donar un pas molt important a l'hora de concretar els principis de Linked Open Data a l'entorn de les biblioteques, i els arxius, i els museus i els centres de documentació. Tres anys més tard la OCLC ha publicat [2] un estudi sobre l'ús dels vocabularis de valors, així com de les raons per les quals aquests s'utilitzen en un conjunt de 123 institucions al llarg del món, encara que predominantment d'àmbit anglosaxó. Aquest estudi es denomina OCLC Research International Linked Data Survey for Implementers. L'única institució espanyola reflectida en aquest estudi és la Fundación Ignacio Larramendi. Els resultats s'han estructurat en 6 entrades del bloc Hangingtogether [3]. Està ja acceptada una comunicació al pròxim congrés de FESABID d'Hernández i Agenjo en què s'analitza el pas del temps entre l'Informe Final i l'enquesta de l'OCLC, així com tot el que això ha comportat. La comunicació es titula Com i què consumir al món Linked Open Data; com i què produir en Linked Open Data.
Un dels aspectes més interessants d'aquesta enquesta és el que es refereix a com es publica la informació Linked Open Data a la web. Evidentment, no es tracta només de consumir, sinó de publicar informació d'acord amb els principis de Linked Open Data, si bé és de témer que les institucions espanyoles -sempre esclaves dels seus sistemes informàtics- es limitin en el millor dels casos a consumir informació . L'exemple del ja antiquat Z39.50 és una prova clara d'això i en el qual es pot veure aquella diferència que Vázquez Montalbán va establir entre globalitzadors i globalitzats, la qual cosa aplicat a aquest cas seria entre els que consumeixen informació Linked Open Data i qui estan en condició de produir-la.
A partir d'aquests postulats, dos importantíssims productors d'informació, -ambdós figuren en els primers llocs en la repetidament esmentada enquesta de la OCLC- han emprès camins diferents en la producció de les seves dades conforme al paradigma de Linked Open Data. La OCLC, més pragmàtica, ha optat per una solució basada en schema.org, mentre que la Library of Congress, més ambiciosa, pretén crear un model Linked Open Data per a la descripció bibliogràfica i per als registres d'autoritat. Conscients d'aquesta situació i d'aquesta divergència, els experts de l'OCLC i de la Library of Congress s'han reunit per produir un informe, que és el que ens ocupa ara. Els editors de l'estudi són Carol Jean Godby, d'OCLC Research, i Ray Denenberg de la Library of Congress. L'estudi està publicat conjuntament per ambdues institucions i pot seguir la discussió en el hashtag de Twitter #ldmodels que, molt encertadament, s'ha creat a l'efecte.
L'estudi s'inicia mitjançant una introducció en la qual es detallen els esforços tant de l'OCLC com de la Library of Congress a aquest entorn, esforç que es va iniciar el 2011. Entre 2011 i 2013 es van desenvolupar importants activitats amb tres idees fonamentals: proporcionar els cercadors descripcions de recursos bibliotecaris d'una manera que puguin ser utilitzats per ells; segon, promoure l'aplicació dels conceptes definits en els models FRBR i RDA i, tercer, oferir una solució que pogués estendre a la descripció de recursos per a la comunitat del patrimoni cultural, entesa en un sentit ampli.
Fruit d'aquests treballs, es va publicar el 2013 un informe, del qual va ser autora la mateixa Carol J. Godby, titulat The Relationships between BIBFRAME and OCLC s Linked-Data Model of bibliographic description: a Working Paper [4] que al meu entendre és magnífic i summament útil. Els treballs han continuat i ja des de 2013 s'ha publicat un nombre veritablement considerable de registres bibliogràfics de l'OCLC i alhora BIBFRAME [5] ha continuat amb el seu desenvolupament (Xavier Agenjo S'inicia la transició?: Adéu a Marbi, benvingut MAC) [6]. Tot el desenvolupament del projecte BIBFRAME s'està seguint per un ampli nombre d'especialistes de tot el món a través de la llista BIBFRAME que és de caràcter públic. La Library of Congress té previst publicar, més endavant en aquest mateix any, un vocabulari revisat, així com llançar un projecte pilot per analitzar si BIBFRAME suporta la catalogació original dels bibliotecaris, tant dels registres bibliogràfics com d'autoritats. També les universitats de Stanford i de Cornell tenen previst llançar projectes anàlegs.
Posades així les coses i atès que des de 2013 i com s'ha dit la OCLC va iniciar un projecte, importantíssim pel seu volum, per editar en Linked Open Data mitjançant schema.org gairebé 200 milions de registres d'obres, en la denominació del model FRBR, utilitzant Linked Data acord amb schema.org i URIs persistents (totes les URIs ho haurien de ser). També l'OCLC dins d'aquest projecte està utilitzant la tecnologia que proporciona bibliograph.net [7] que és una col·lecció d'esquemes que s'utilitzen com a extensió de schema.org, el que per cert és molt útil i senzill i tots els bibliotecaris interessats en aquestes matèries haurien, almenys, de donar-li un cop d'ull.
En 2013 la relació dels models de BIBFRAME i schema.org es visualitzava en aquest diagrama que reprodueixo a partir de la imatge creada per Godby per OCLC Research
Com clarament mostra la imatge, el model Linked Data de l'OCLC és similar al de BIBFRAME especialment pel que fa a la definició d'entitats com a obra, instància, organització i persona, però hi ha diferències que es basen en quin és l'objectiu de cadascun dels models. Mentre que el de BIBFRAME és, parlant clar, substituir al format MARC perquè pugui utilitzar-se per les descripcions bibliogràfiques i d'autoritats, el model Linked Data desenvolupat per l'OCLC pretén optimitzar les descripcions dels recursos bibliotecaris per a serveis de localització a la web ( discovery) més enllà de les pròpies biblioteques, de tal manera que pugui ser utilitzat pels cercadors de propòsit general. De fet si els objectius de schema.org es compleixen s'haurà millorat enormement la visibilitat de les biblioteques a la web.
A la vista d'aquests fets cal, doncs, fer confluir, en la mesura del possible, els dos enfocaments de tal manera que puguin evitar els solapaments. Com ja he esmentat abans, està previst que el 2015 es publiqui una anàlisi tècnica comparada dels dos models, però mentrestant s'ha publicat el document que ara ressenyo, que pretén donar una primera visió i acostament a aquest futur estudi.
Potser convingui destacar que tant BIBFRAME [8] com OCLC [9] utilitzen el model de FRBR d'una manera simplificada, definint classes RDF per a les diferents entitats que sense ser idèntiques poden ser compatibles. No obstant això, hi ha tres grans diferències que recalcar. La primera és que el model de BIBFRAME, que a mi personalment m'agrada moltíssim, defineix classes RDF tant per l'obra com per la instància, mentre que l'OCLC només ho fa per a l'obra. En opinió de Godby i d'Denenberg aquesta diferència no suposa una incompatibilitat, encara que en la meva opinió personal si és un problema considerable que haurà de ser resolt. La segona diferència, que és importantíssima, defineix a l'entitat autoritat com una classe RDF, però això no passa així en els models Linked Data de l'OCLC. En el model de l'OCLC l'autoritat és informal, el que òbviament desnaturalitza la funció mateixa de registre d'autoritat i com bé assenyalen Godby i Denenber haurà d'analitzar molt detalladament en els propers informes tècnics. En tercer lloc, BIBFRAME defineix com a classe RDF, com anotació, tot allò que en el model de l'OCLC es pot descriure com revisions, sumaris, cobertes i exemplars, la qual cosa té alternatives dins del model OCLC / schema.org mitjançant formulacions que el text en anglès qualifica com parsimonious, el que és tan divertit que no ho tradueixo, però que sí que esmento per a tots aquells que creuen que els aspectes tècnics de la catalogació són avorrits. Una altra diferència important és l'ús del vocabulari que utilitzen tant BIBFRAME com schema.org; en el cas de BIBFRAME s'ha creat, o per millor dir, s'està creant un vocabulari específic del qual schema.org manca.
En resum, l'anàlisi comparada del model de BIBFRAME i del model OCLC / schema.org presenta considerables diferències en la granularitat, aquesta gran aportació del format MARC. El document objecte d'aquesta ressenya mostra els admirables esforços de la iniciativa BIBFRAME promoguda per la Library of Congress i un ampli conjunt d'institucions de primera fila de tot el món; i d'altra banda, de l'OCLC i la seva molt més pragmàtica iniciativa d'aplicar schema.org als registres bibliogràfics, no oblidem gairebé 200 milions que ja s'estan publicant a la web [10].
Aquesta envejable, sobretot des d'aquests pagaments, necessitat de coordinar els esforços d'institucions de primer ordre conduirà, sens dubte, a un model de dades que s'ajusti als principis Linked Open Data i sigui recolzat per institucions de primer nivell.
Aquesta ressenya del document que han produït OCLC i la LC té com a objecte difondre entre els especialistes de parla espanyola i catalana aquesta magnífica iniciativa que, naturalment, cal qualificar de biblioteconòmica i animar els bibliotecaris espanyols i hispanoamericans a no ser merament espectadors d'aquest procés sinó actors del mateix, ajustant les seves tècniques catalogràfiques i els seus programes de gestió de biblioteques a aquests principis amb l'objectiu de poder consumir recursos Linked Open Data i més de ser capaços de produir.
[1] http://www.larramendi.es/i18n/cms/elemento.cmd?grupo=estaticos/paginas&e...
[2] http://www.larramendi.es/i18n/cms/elemento.cmd?id=novedades/noticias/La_...
[3] http://hangingtogether.org/?p=4137
[4] http://www.oclc.org/content/dam/research/publications/library/2013/2013-...
[5] http://www.loc.gov/bibframe/
[6] http://www.thinkepi.net/%C2%BFse-inicia-la-transicion-adios-a-marbi-bien...
[8] http://bibframe.org/vocab/Work.html
[9] http://schema.org/CreativeWork
[10] http://www.oclc.org/developer/develop/linked-data/worldcat-entities/worl...