Open Data del Sistema Archivistico Nazionale

Benvenuti nella sezione Open Data del Sistema Archivistico Nazionale - SAN

L'ICAR ha intrapreso un percorso per rendere accessibili i contenuti del Sistema Archivistico Nazionale - SAN in formato Open Data secondo le modalità e le tempistiche  previste dal Decreto Crescita 2.0 convertito nella legge 221/2012.

Un OAI Provider rende accessibili in formato Open Data i contenuti del SAN relativi alle seguenti entità: conservatori di archivi, produttori di archivi, complessi archivistici, strumenti di ricerca, oggetti digitali.

L'OAI Provider rende disponibili metadati in formato XML strutturati secondo i diversi schemi relativi alle entità sopra citate:

•·         ead-san (xml): schema XML per la descrizione dei soggetti produttori del SAN

•·         eac-san (xml): schema XML per la descrizione dei complessi archivistici del SAN

•·         ricerca-san (xml): schema XML per la descrizione degli strumenti di ricerca del SAN

•·         scons-san (xml): schema XML per la descrizione dei soggetti conservatori del SAN

•·         mets-san (xml): schema XML per la descrizione degli oggetti digitali del SAN

Il set oai disponibile è denominato SAN e permette l'accesso a tutte le informazioni disponibili nel Sistema Archivistico Nazionale attraverso l'indirizzo http://www.san.beniculturali.it/oaicat/

Il protocollo OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) è descritto all'indirizzo http://www.openarchives.org/OAI/openarchivesprotocol.html.

Gli schemi XML ead-san, eac-san, ricerca-san, scons-san, mets-san sono descritti nella pagina degli standard del sito dell'Istituto Centrale per gli Archivi all'indirizzo http://www.icar.beniculturali.it/index.php?it/169/gestione-documentale-e-archivi-storici

Secondo la scala di valutazione dell'apertura e accessibilità dei dati introdotta nel 2006 da Tim Berners Lee, i dati Open Data del SAN attualmente disponibili sono a Tre Stelle in quanto "il dato è disponibile sul web in un formato strutturato non proprietario (xml e xml schema)".

Alla prima necessaria azione di pubblicazione di Open Data, prevista per tutta la Pubblica Amministrazione nel suo complesso, attraverso un oai provider dei propri dati secondo gli schemi CAT-SAN, l'ICAR ha affiancato un progetto per lo sviluppo e la pubblicazione di Linked Open Data di ambito archivistico.

Gli obiettivi di questo progetto sono:

•·         La definizione di una Ontologia di base che rappresenti lo schema concettuale della struttura informativa espressa dai tracciati CAT SAN (standard di rappresentazione dei dati SAN);

•·         La definizione di estensioni all'Ontologia di base per l'integrazione di entità esterne e relazioni tra oggetti attualmente non presenti all'interno del SAN, ma residenti nei sistemi di provenienza o in altre fonti individuate  (ufficiali o rese disponibili come risorse LOD: geonames, dbpedia,  etc.) anche se non strettamente archivistiche;

•·         La realizzazione di liste di authority, repertori e strumenti su scala nazionale da mettere a disposizione della comunità archivistica

•·         L'elaborazione di una lista di autorità di toponimi su scala nazionale, basata principalmente sulla rielaborazione in formato LOD di dati istituzionali (fonte ISTAT) integrabili con fonti di particolare rilevanza storica, che sarà sperimentalmente raccordata coi dati SAN LOD di provenienza Guida Generale degli Archivi di Stato. Questa operazione permette l'immissione nel sistema di nuova "conoscenza" attraverso l'integrazione di un repertorio di informazioni storico-geografiche di estrema rilevanza per l'ampliamento della portata informativa dei dati archivistici

•·         La disponibilità di ulteriori strumenti di accesso ai dati LOD prodotti (endpoint sparql, oai provider, set specifici di dati LOD, etc.).

Obiettivo principale dell'intero progetto, in coerenza con il mandato istituzionale dell'Istituto, è la definizione di una ontologia estesa che modelli l'intero schema concettuale dei dati SAN e ne permetta il riuso in perfetta coerenza scientifica con le indicazioni sugli standard di dominio adottati nel 2009 dalla Sottocommissione tecnica per la definizione dei metadati relativi alle risorse archivistiche rese  accessibili attraverso il Sistema Archivistico Nazionale.

Le attività, avviate nello scorso mese di Marzo, hanno consentito l'individuazione delle diverse entità, i domini di riferimento e la loro rappresentazione in un'ontologia formale.

open data

Il modello adottato tiene conto di elementi qualificanti come la rappresentazione formale della cardinalità degli elementi del tracciato CAT e la definizione di vocabolari controllati ad uso della comunità, anche ai fini della standardizzazione delle voci.

Nella definizione dell'ontologia del Sistema Archivistico Nazionale vengono presi in considerazione, oltre agli standard di dominio,  anche i principali namespaces in ambito LOD del dominio "Cultural Heritage" al fine di consentire le operazioni di riconciliazione necessarie alla loro integrazione in ambiente Linked Data.

In un momento successivo verranno predisposti anche gli strumenti di accesso pubblico ai dati SAN in formato Linked Open Data secondo l'ontologia presentata.

In tal modo, le migliaia di schede sui conservatori d'archivio e le decine di migliaia di schede su produttori di archivi e complessi documentari che coprono l'intero territorio nazionale saranno disponibili all'uso comune ed aperto.

I primi risultati di tale attività sono state presentati al Forum della Pubblica Amministrazione il 28 Maggio 2013, nell'ambito delle presentazioni delle attività del Ministero per i Beni e le Attività Culturali e del Turismo, e il 14 giugno 2013 nel corso del seminario "La Storia al tempo degli open data" promosso dalla Società per gli Studi di Storia delle Istituzioni.

Secondo il cronoprogramma che è stato presentato, si prevede il rilascio di una prima versione dell'ontologia SAN secondo il modello della discussione pubblica. Il modello sarà successivamente discusso nel corso di un seminario largamente partecipato.

Gli Open Data del SAN seguono la licenza Italian Open Data Licence V.2.0 (IODL 2.0) disponibile all'indirizzo http://www.dati.gov.it/iodl/2.0/.

La licenza IODL 2.0 prevede che l'utente possa liberamente:

1) consultare, estrarre, scaricare, copiare, pubblicare, distribuire e trasmettere le informazioni;

2) creare un lavoro derivato, per esempio attraverso la combinazione con altre informazioni includendole in un prodotto o sviluppando un'applicazione informatica che le utilizzi come base dati.

3) l'utente deve indicare la fonte delle informazioni e il nome del soggetto che fornisce il dato, includendo, se possibile, un link alla licenza.