Tre erano le figlie del re: pianificazione, sviluppo e sfruttamento sui dati scientifici

Versió per a imprimirVersió per a imprimir
Inma Aleixos. Universitat Politècnica de València
Ricardo Albiñana. Universitat Oberta de Catalunya
José Morales.  Universitat Ramon Llull
Fernanda Peset. Universitat Politècnica de València
 

- Erway, Ricky. 2013. Starting the Conversation: University-wide Research Data Management Policy. Dublin, Ohio: OCLC Research. http://www.oclc.org/content/dam/research/publications/library/2013/2013-08.pdf
- LERU Research data Working group / LERU Roadmap for research data // LERU, 2013. Advice paper; 14. http://www.uzh.ch/research/LERU_Roadmap_for_Research_data.pdf
- Sergey Filippov / Mapping Text and Data Mining In academic and Research Communities in Europe // Lisbon Council 2014; special briefing issue 16. http://www.lisboncouncil.net/publication/publication/109-mapping-text-and-data-mining-in-academic-and-research-communities-in-europe.html

 

Sembra che continuiamo con la tradizione di riunire in una sola rassegna tre relazioni di tematica comune (Peset, 2013; Fenoll 2014). È questa la terza volta, raggiungendo il tre con tre. Cercando di trovare un filo conduttore alle relazioni di questo articolo, potremmo leggerle seguendo l'ordine seguente: si inizia da Erway, si prosegue con LERU per terminare con Filippov. Lo abbiamo dedotto dopo averli letti, in quanto il primo identifica gli stakeholders nell'ambito dei dati di ricerca e presenta il ruolo di primo piano che può assumere la biblioteca, il secondo informa ampiamente su ciò che deve essere gestito ed infine Filippov dà esempio di come l'analisi dei dati con tecniche di mining possa evidenziare il valore dei datasets, unica giustificazione alla frase “i dati sono il nuovo petrolio dell'economia”.

Erway, Senior Program Officer, della OCLC Research, invita i direttori delle biblioteche universitarie ad agire per avviare le conversazioni tra gli stakeholders più importanti dell'università: Vicerettori di ricerca, OTRI, servizi informatici, ricercatori e biblioteca. Il personale di biblioteca possiede conoscenze ed esperienza adatte per portare a termine i doveri di data curation. È l'occasione per assumere un ruolo imprenditoriale nel compito di stabilire politiche di gestione e conservazione dei dati in ciascuna università. Noi consideriamo che è un'idea appropriata per le università nordamericane, con biblioteche protagoniste del processo di apprendimento e di ricerca, mentre in Spagna esistono alcuni ostacoli in quanto queste sono organizzazioni sono più gerarchizzate e burocratizzate.La biblioteca spagnola, prima di iniziare un rapporto, deve garantire la formazione del personale sulle questioni affrontate nella seconda metà della relazione; vi include gli elementi affinchè il rapporto risulti fruttifero, anche se non si specifica se sono minimi o massimi; si presenta in formato domande: chi possiede i dati? Quali imposizioni esterne esistono su di essi? Quali e per quanto tempo dovrebbero essere trattenuti? Come dovrebbe essere conservati i dati digitali? Ci sono considerazioni etiche da fare? Come vi si accederà? Quanto aperti dovrebbero essere? Come si gestiranno i costi? Quali alternative ci sono alla gestione locale dei dati?

Sono tutte domande accuratamente studiate nella relazione LERU. Vengono presentati sei aspetti da tenere in considerzione, con un capitolo per ciascuno, con dettagli, studi di casi e raccomandazioni. Il settimo capitolo raccoglie tutte le raccomandazioni, riunite secondo i diversi protagonisti. Il primo capitolo, su politiche e leadership, suggerisce che ogni università crei una propria tabella di marcia per lo sviluppo di una politica istituzionale che coinvolga tutti gli stakeholders. Il secondo capitolo, sulla promozione (advocacy), elenca le differenti barriere, gli incentivi e gli elementi che facilitano l'interscambio di dati in aperto. Il terzo capitolo comprende temi come la selezione, l'acquisizione, il trattamento, la descrizione, la citazione e temi legali sui dati di ricerca. Il quarto capitolo propone un'infrastruttura socio-tecnica che includa gli stessi dati, i loro strumenti di gestione, i componenti tecnici ed il personale. Il quinto capitolo riconosce la necessità di trovare fonti alternative di finanziamento per coprire la gestione e la conservazione dei dati, mentre riconosce che i modelli di spesa attuali sono ancora in via di sviluppo; suggerisce la condivisione di spese e servizi tra diverse istituzioni. Il sesto capitolo (ruoli, responsabilità e competenze) comprende proposte formative sin dalle prime fasi degli studi postuniversitari; sorprendentemente però non chiarisce chi, tra tutti i soggetti coinvolti nella gestione dei dati di ricerca, debbano essere i formatori.

L'ultimo rapporto definirebbe il circolo virtuoso del nuovo modello economico che chiedono i nostri governanti, un'economia basata sulla conoscenza e l'innovazione, in cui i dati saranno il motore della crescita. Filippov studia per il Lisbon Council la situazione della ricerca in data e text mining in Europa, visto che Stati Uniti e Cina stanno vincendo la partita contra il vecchio continente. Utilizza due metodi: una statistica descrittiva sui dati bibliografici estratti da ScienceDirect della Elsevier (data o text mining sul titolo) e sui dati di brevetti (EspaceNet patent database) ed interviste, alcune anonime, con accademici ed esperti del settore, come per esempio il nostro collega di INGENIO Ismael Ràfols. Arriva alla conclusione, con il primo metodo, che la Gran Bretagna è leader in Europa e che uno dei grandi problemi è una legislazione molto restrittiva e variegata in materia di diritti d'autore degli insiemi di dati, su cui si potrebbe fare ricerche con tecniche di data mining, come rilevato anche da LERU (raccomandazione numero 71).

È da sottolineare in questa relazione il fatto che la comunità di studiosi di bibliometria rivendica essere una pioniera nella ricerca ed applicazione di tecniche di mining, oggi del tutto accettata grazie all'esplosione socioeconomica di Big Science. La ricerca di Filippov tuttavia prende una piega verso i Paesi Bassi, per il database utilizzato, per le interviste proposte e per utilizzare o evitare di menzionare dati di altri paesi per convenienza. A scopo puramente aneddotico, segnaliamo che giustifica la “gloriosa” seconda posizione della Spagna nella classifica per lingue, attribuendola alla nostra unione idiomatica con l'America Latina. Meglio non commentare.

Per concludere, le tre relazione formano un'unità sul tema dei dati scientifici. Contengono raccomandazioni rivolte a figure di grande responsabilità (Dirigenti della UE sul Copyright e Base  dati) o identificano l'eterogeneità delle attitudini delle riviste scientifiche rispetto ai dati. Questi aspetti, in particolare in Europa, possono ostacolare lo sfruttamento dei dati, e non si può evitare di esporli insieme ai temi riguardanti la creazione e la gestione dei dati. In fondo dietro questi ci sono delle persone, che sono il vero motore del movimento. E per questo ci chiediamo: da chi potremmo iniziare un dialogo interno allo stato spagnolo? Noi, dal progetto DATASEA, siamo a disposizione di qualsiasi agente interessato a questi temi.


Bibliografia
Fenoll, Carme. Tres en uno: Australia, Canadá y la IPA nos ofrecen benchmarking en préstamo digital a bibliotecas públicas. Blok de BiD, 30/07/2014
García-García, Alicia; Peset, Fernanda. Tres en uno, tres informes sobre la gestión de los datos de investigación Blok de BiD, 04/09/2013