Modeling Linkable Multidimensional Cubes with Logical Patterns
Authors
Jakobsen, Kim Ahlstrøm ; Andersen, Alex Bondo
Term
4. term
Education
Publication year
2014
Submitted on
2014-06-04
Pages
81
Abstract
Mange beslutningsstøttesystemer (DSS) besvarer forretningsspørgsmål ved kun at bruge en organisations lokale data, hvilket kan give et begrænset billede. Ad hoc-dataintegration—midlertidig tilførsel af situationsbestemte eksterne data—gør det muligt at besvare flere spørgsmål. Linked Data i Resource Description Framework (RDF), en standard til at repræsentere sammenkædede data, er lovende, fordi mængden vokser, og kilder er forbundne. Vi undersøger at lagre både lokale og situationsdata i RDF, så man kan stille spørgsmål på tværs af dem. Vi viser, hvordan forretningsspørgsmål kan besvares ved hjælp af RDF-datakuber (multidimensionelle sammenfatninger brugt i Online Analytical Processing, OLAP) annoteret med QB4OLAP-vokabularet; dem kalder vi Linkable Multidimensional (LMD) kuber. Vi introducerer tre logiske mønstre (designvalg) for LMD-kuber med forskellige afvejninger mellem indlæsningstid, lagerstørrelse og tid til at evaluere forespørgsler. Vi præsenterer også en ny algoritme, Semantic Web OLAP Denormalizer (SWOD), der konverterer kuber fra ét mønster til et andet. For at undersøge dette konverterer vi det velkendte TPC-H-datasæt til RDF, beskriver det som LMD-kuber og evaluerer vores mønstre med forespørgsler baseret på TPC-H's forretningsspørgsmål.
Many decision support systems (DSS) answer business questions using only an organization’s local data, which can give a limited view. Ad hoc data integration—temporarily adding situationally appropriate external data—helps answer more questions. Linked Data published in Resource Description Framework (RDF), a standard for representing interlinked data, is attractive because it is growing and connects many sources. We investigate storing both local and situational data in RDF so that questions can be asked across them. We show how business questions can be answered using RDF data cubes (multidimensional summaries used in Online Analytical Processing, OLAP) annotated with the QB4OLAP vocabulary; we call these Linkable Multidimensional (LMD) cubes. We introduce three logical patterns (design options) for LMD cubes with different trade-offs in load time, storage size, and query evaluation time. We also present a new algorithm, Semantic Web OLAP Denormalizer (SWOD), that converts cubes from one pattern to another. To study these ideas, we convert the well-known TPC-H dataset to RDF, describe it as LMD cubes, and evaluate our patterns using queries based on TPC-H business questions.
[This abstract was generated with the help of AI]
Documents
