Jena Bloom: Query Execution with Bloom Filter Existence Check

Studenteropgave: Kandidatspeciale og HD afgangsprojekt

  • Martin Pekár Christensen
4. semester, Software, Kandidat (Kandidatuddannelse)
I de seneste år har grafdatabaser, triplestores og vidensgrafer i stigende grad tiltrukket interesse. Det er dog stadig en udfordring at forespørge triplestores effektivt, da mange optimeringsstrategier fra traditionelle databaser stadig ikke er udforskede. Som et første skridt til at optimere triplestores undersøger denne artikel spørgsmålet om, hvordan man kan forbedre forespørgselstiden ved at adressere omkostningstunge eksistenstjek i join-operationer. For at nå dette mål integrerer vi et Bloom-filter, der kompakt befinder sig i primær-hukommelsen, der skal bruges i stedet for diskbaserede indekser til eksistenstjekoperationer. Vi anvender desuden vidensgrafsstatistik til at bestemme de specifikke join-operationer, hvor Bloom-filter eksistenstjek gavner eksekveringstiden. Vi udvider en reference triplestore (Jena) med Bloom-filtre og integrerer vores tilgang til forespørgselsoptimering. Vi evaluerer vores tilgang, JenaBloom, på et stort sæt af mere end 1.500 forespørgsler og viser dens effektivitet på forespørgsler, der returnerer tomme resultatsæt, samt dem, der returnerer ikke-tomme resultatsæt.
SprogEngelsk
Udgivelsesdato10 aug. 2023
Antal sider10
ID: 545733769