PEC: ic-a@pec.cultura.gov.it  e-mail: ic-a@cultura.gov.it   tel: (+39) 06 5190976

Istituto Centrale per gli Archivi - ICAR


Il thesaurus unico

La progettazione
Per la costruzione del thesaurus unico si è partiti dal confronto degli indici contenuti nei thesauri sia delle collezioni presenti nel portale sia di quelle in procinto di essere aggiunte. Ne è stata creata pertanto una lista, con il fine di individuare sinonimie e disomogeneità formali e di identificare alcune categorie semantiche tanto ampie da poter accogliere, oltre gli indici esistenti, anche quelli che in un futuro potrebbero essere aggiunti.
Si è proceduto quindi ad una omogeneizzazione testuale. I maggiori accorgimenti da questo punto di vista sono stati:

  • inserire tra parentesi tonde qualsiasi tipo di elemento che specifichi il testo che le precede;
  • riguardo ai nomi di persona, inserire il cognome seguito da una virgola, dall’eventuale qualifica (es. dottor) e infine dal nome (nel caso non vi fosse il nome si è mantenuto il cognome seguito dalla virgola e dalla qualifica: es. Finzi, dottor; nel caso non vi fosse il cognome si è mantenuto il nome anticipato dall’eventuale qualifica: es. Don Nello);
  • riguardo a persone o entità che presentano nomi alternativi – pseudonimi o soprannomi –  inserire il nome originale come primo elemento seguito da alias e dal nome alternativo (es. Fissore, Giusto alias Lepre);
  • riguardo a nomi che presentano delle sigle, inserire il nome originale come primo elemento e mettere tra parentesi la sigla (es. Società Nazionale Officine di Savigliano (SNOS) a differenza del precedente SNOS);
  • determinare le fasi cronologiche secondo gli anni, mettendo tra parentesi specificazioni di altro genere (es. 1945-1946 (Governo De Gasperi) a differenza del precedente Governo De Gasperi).

Inoltre è stata compiuta una specializzazione delle forme testuali affinché in futuro non si creino sinonimie con nuove annessioni riducendo pertanto il lavoro di manutenzione e modifica del thesaurus unico (es. l’indice Biografia è stato modificato in Vita privata degli alti funzionari). Tale scelta ha portato di conseguenza ad avvicinarsi ad un modello di thesaurus pre-coordinato più che ad uno post-coordinato.
Quando ci si è imbattuti in indici che indicavano periodizzazioni differenti di una stessa entità (es. Russia e Unione Sovietica (URSS)) si è deciso di conservare entrambe le voci, aggiungendo ad una o ad entrambe una definizione che ne chiarisse il significato (es. Unione Sovietica (URSS) = Definizione: stato federale esteso in territori di solito attribuiti in parte all'Europa orientale e in parte all’Asia centro-settentrionale, costituitosi a seguito della rivoluzione del 1917 e della conseguente caduta dell’Impero russo, e dissoltosi nel 1991, con la conseguente nascita della Federazione Russa). Le voci inoltre sono state legate da una relazione di tipo associativo.
Per conservare la possibilità di ricerca e di accessibilità diretta da parte dei fruitori a ciascuna collezione del portale, pur attraverso un unico thesaurus, si è fatto in modo che la struttura di questo ricalcasse, sotto certi aspetti, quella delle tre collezioni. Ad esempio le tematiche di ciascuna collezione sono state ricondotte a un determinato indice subordinato a Temi: si tratta di Pubblica amministrazione per le tematiche di “Ombra del potere. I gabinetti e gli uffici legislativi dei ministri”, Manicomio per quelle di “Per una storia orale del ex Ospedale Psichiatrico Santa Maria della Pietà”, Seconda guerra mondiale per “Guerra e resistenza a Savigliano”.

Relazioni semantiche
Le categorie principali individuate a seguito del confronto degli indici e corrispondenti ai concetti principali del thesaurus unico sono: Entità nominate (suddivisa nelle sottocategorie Enti e organizzazioni e Persone), Luoghi, Fasi cronologiche e Temi. Ad esse è stata associata una “nota d’uso” che specifica l’accezione con la quale è utilizzato tale concetto (es. Luoghi = Nota d’uso: estensioni territoriali di piccole o grandi dimensioni delimitate da differenti tipologie di confini (fisici o antropici)). Ad alcune di esse è stata associata anche una nota “esempi” all’interno della quale sono elencate alcune esemplificazioni del concetto (es: Luoghi = Esempi: nazioni, regioni, centri abitati, località, quartieri, frazioni...). Ciò è stato fatto non solo per facilitare la ricerca da parte del fruitore del portale ma anche per fornire, a chi dovrà in futuro inserire nel thesaurus unico le annotazioni di una nuova collezione, chiari riferimenti semantici sui quali potersi basare.
Gli indici dei thesauri sono stati quindi ordinati all’interno di tali categorie in base al rapporto semantico “più generico/più specifico”, secondo il quale gli indici subordinati sono semanticamente più specifici dei loro sovraordinati, i quali di conseguenza sono semanticamente più estesi dei loro subordinati. All’interno della relazione “più generico/più specifico” è stato incluso anche il rapporto “tutto/parte” presente tra i nomi di persona e i gruppi di appartenenza (es. Politici e Berlinguer, Luigi). È stata ammessa l’esistenza di alcune poligerarchie, ossia la possibilità che un indice sia subordinato a più indici allo stesso tempo. È il caso ad esempio di Frattini, Franco che si trova sia sotto Individui, sia sotto Funzionari dello stato, sia sotto Politici. L’identificazione delle poligerarchie è stata fatta sulla base delle interviste conservate nel portale: prendendo l’esempio precedente, Frattini, Franco è nominato in esse sia come individuo, sia come funzionario dello Stato sia come politico.
Dopo le relazioni gerarchiche sono state stabilite quelle di tipo associativo. Ciò ha permesso di collegare trasversalmente gli indici appartenenti a diverse categorie: un evento con una fase cronologica (es. 1915-1918 (Italia) e Prima guerra mondiale, 1968 e Contestazione giovanile), un tema con un gruppo di persone (Resistenza e Partigiani, Giornalismo e Giornalisti), una persona con un partito politico (es. De Gasperi, Alcide e Democrazia cristiana).

Standard SKOS e interoperabilità con l’Atlante Storico Istituzionale dell’Italia unita
Una volta progettata la struttura del thesaurus unico, ho proceduto a trascriverlo in SKOS. Le proprietà di questo linguaggio utilizzate nella trasposizione sono state skos:broader e skos:narrower per i rapporti gerarchici del tipo “più generico/più specifico”, skos:related per i rapporti di tipo associativo, skos:definition per le definizioni associate agli indici riferiti a periodizzazioni differenti di una stessa entità, skos:scopeNote per le note d’uso, skos:example per gli esempi. Ogni concetto del thesaurus unico è diventata una risorsa rintracciabile e riusabile attraverso la creazione e l’associazione ad esso di un URI. Per fare in modo che i nuovi concetti rimandino – una volta diventato operativo il vocabolario – a quelli dei vecchi thesauri, si è ricorso alla proprietà skos:exactMatch, la quale permette di creare una perfetta coincidenza semantica tra concetti appartenenti  a diversi schemi concettuali.
Per alcuni concetti è stata fatta un’eccezione, associando non URI creati appositamente ma quelli presenti all’interno di un altro portale dell’ICAR, l’Atlante Storico Istituzionale dell’Italia unita. All’interno di questo portale è stata creata infatti un’ontologia che descrive le unità geografiche e amministrative italiane dall’unità ai giorni nostri (associate a degli URI). Poiché anche nel thesaurus unico sono presenti riferimenti a questo tipo di entità, ho associato a tali concetti gli URI dell’Atlante Storico Istituzionale dell’Italia unita, così da rendere le due risorse interoperabili. Questo è un esempio concreto di come nel Web Semantico, grazie ai sistemi organizzati di conoscenza, si possa utilizzare un medesimo URI per descrivere due risorse distinte.

Passi ulteriori
Lo studio di fattibilità portato avanti durante questi mesi ha evidenziato la possibilità della creazione di un thesaurus unico che permetta la descrizione e l’accesso ai materiali audiovisivi conservati in “Ti racconto la storia”. Al momento ci sono ancora alcune analisi da completare prima di portare a conclusione il lavoro. Innanzitutto è ancora da vagliare la possibilità di una convivenza tra il nuovo vocabolario e i thesauri locali delle rispettive collezioni. A tal proposito è stata valutata l’ipotesi di un thesaurus “intermedio” che raccolga soltanto gli indici condivisi dai diversi vocabolari locali.
Un ulteriore obiettivo per il futuro è l’integrazione del nuovo vocabolario all’interno del Thesaurus SAN, strumento di supporto alla descrizione delle diverse risorse provenienti dai sistemi aderenti al Sistema Archivistico Nazionale, con il fine di una maggiore interoperabilità.



Ultimo aggiornamento: 27/07/2022