Salta al contenuto principale
In caricamento...

Il paradigma OBDA

L'Ontology-based Data Access (OBDA) è un nuovo paradigma, basato sull'utilizzo di tecniche di rappresentazione e ragionamento della conoscenza, per la gestione delle risorse (dati, meta-dati, servizi, processi, etc.) di sistemi informativi moderni. L'approccio OBDA è il risultato di più di dieci anni di ricerca portata avanti dal gruppo DASILab del Dipartimento di Ingegneria Informatica Automatica e Gestionale "Antonio Ruberti" alla Sapienza Università di Roma, sotto la guida del Prof. Maurizio Lenzerini, ed ora anche dalla OBDA Systems. Negli ultimi anni questa ricerca si è trasformata in lavoro sul campo, in collaborazione con compagnie leader dei settori pubblici e privati, sia in Italia che all'estero.



OBDA: una architettura a tre livelli

L'idea chiave dell'OBDA è offrire agli utenti un accesso alle informazioni custodite nelle loro banche dati attraverso una architettura a tre livelli, costituiti dall'ontologia, dalle sorgenti, e dai mapping tra le due, dove l'ontologia è una descrizione formale del dominio di interesse, ed è il cuore del sistema. Attraverso questa architettura, l'OBDA fornisce una connessione semantica punto-a-punto tra utenti e sorgenti dati, permettendo di effettuare interrogazioni direttamente su dati che sono disseminati attraverso molteplici sorgenti distribuite, attraverso il vocabolario a loro familiare dell'ontologia: l'utente infatti formula della query SPARQL sull'ontologia, che vengono trasformate, attraverso lo strato di mapping, in query SQL sui database relazionali sottostanti.

Lo strato dell'Ontologia

Lo strato dell'Ontologia nell'architettura è il mezzo per perseguire un approccio dichiarativo all'integrazione dei dati, e, più in generale, alla loro governance. La base di conoscenza del dominio dell'azienda viene specificato attraverso una descrizione formale e di alto livello dei suoi aspetti sia statici che dinamici, costituita dall'ontologia. Attraverso l'esplicitazione della rappresentazione del dominio, si guadagna in riusabilità della conoscenza acquisita, che invece non è possibile ottenere quando lo schema globale è semplicemente una descrizione unificata delle sorgenti di dati sottostanti.

Lo Strato dei Mapping

Lo strato dei Mapping collega lo strato dell'Ontologia con lo strato delle Sorgenti di Dati, definendo le relazioni tra i predicati ontologici da una parte e le sorgenti dati dall'altra. Queste mappature non vengono solamente utilizzate per l'operabilità del sistema informativo, ma possono costituire una risorsa preziosa per scopi di documentazione nei casi in cui l'informazione sui dati è sparsa in diverse parti, e quindi è difficile da accedere e spesso non conforme agli standard comunemente adottati.

Lo Strato delle Sorgenti

Lo strato delle Sorgenti Dati è composto dalle banche dati esistenti dell'organizzazione.


Vantaggi dell'approccio

Nell'OBDA, il cliente del sistema informativo può interagire con il sistema attraverso una rappresentazione astratta del dominio, eliminando l'intermediario, tipicamente rappresentato dall'esperto IT. Utenti possono formulare query in base ai concetti del dominio piuttosto che sulle strutture dei dati nelle sorgenti. Considerando l'ontologia ed i mapping verso le banche dati, il sistema OBDA è in grado di trasformare le query originali sull'ontologia in query da valutare sulle sorgenti.

L'OBDA può essere interpretata come una forma di integrazione dell'informazione, dove lo schema concettuale che viene solitamente adottato è rimpiazzato dal modello concettuale del dominio applicativo, formulato come una ontologia. Attraverso questo approccio, la visione integrata che il sistema offre ai consumatori finali non è solamente una struttura dati che concilia le dati nelle sorgenti, ma una descrizione semanticamente ricca dei concetti rilevanti nel dominio di interesse, oltre che delle relazioni che esistono tra questi concetti.

L'approccio OBDA non impone di integrare tutte le sorgenti in un unico momento. Piuttosto, dopo aver costruito una bozza preliminare del modello del dominio, è possibile aggiungere ulteriori strutture dati o nuovi elementi in modo incrementale, quando diventano disponibili oppure quando se ne ha bisogno, ammortizzando in questo modo il costo dell'integrazione. Di conseguenza, il progetto globale può essere interpretato come un processo incrementale di acquisizione di conoscenza e di rappresentazione del dominio, delle sorgenti dati disponibili, e delle relazioni che esistono tra questi due oggetti. L'obiettivo finale è sostenere l'evoluzione sia dell'ontologia che dei mapping in modo tale che il sistema continua a essere operativo mentre sta evolvendo.

L'ontologia e le sue mappature verso le sorgenti di dati forniscono un terreno comune per la documentazione di tutta l'informazione dell'azienda, con ovvi vantaggi per la governance e la gestione del sistema informativo.

Ricerca e documentazione