Cerca nel sito per parola chiave

pubblicazioni - Memoria

Chimera: A Bridge Between Big Data Analytics and Semantic Technologies

pubblicazioni - Memoria

Chimera: A Bridge Between Big Data Analytics and Semantic Technologies

Negli ultimi decenni, l’analisi potenziata di Knowledge Graph (KG) è stata utilizzata per estrarre approfondimenti avanzati dai dati.

Diverse aziende hanno integrato database relazionali legacy con tecnologie semantiche utilizzando l’accesso ai dati basato sull’ontologia (OBDA). In pratica, questo approccio consente agli analisti di scrivere query SPARQL sia su KG che su origini dati relazionali SQL, rendendo trasparenti la maggior parte dei dettagli di implementazione. Tuttavia, il volume dei dati è in continuo aumento e un numero crescente di aziende sta adottando piattaforme di storage distribuito e motori di calcolo distribuiti. C’è un divario tra i big data e le tecnologie semantiche. In cima, uno dei sistemi OBDA di riferimento, è limitato ai database relazionali legacy e manca ancora la compatibilità con il motore di analisi dei big data Apache Spark. Questo documento introduce Chimera, una suite di software open source che mira a colmare tale lacuna. Chimera abilita un nuovo tipo di pipeline di data science di andata e ritorno. I data scientist possono eseguire query sui dati archiviati in un data lake utilizzando SPARQL tramite Ontop e SparkSQL salvando i risultati semantici di tale analisi nel data lake. Questo nuovo tipo di pipeline arricchisce semanticamente i dati di Spark prima di salvarli nuovamente.

Progetti

Commenti