Leveling the Playingfield: Comparing Relational and Graph Query Executions
Authors
Madsen, Christian Læssøe ; Christensen, Nicklas Klint Dudal Mølgaard ; Nørfjand, Rasmus Bertelsen
Term
4. term
Education
Publication year
2026
Submitted on
2026-06-12
Abstract
This thesis investigates how different data representations and database technologies perform when handling large-scale spatial and trajectory data on road networks. Within a single PostgreSQL environment, it compares a graph-based approach using Apache AGE, which implements Labeled Property Graphs and the Cypher query language, with a classic Geographic Information System (GIS) approach based on PostGIS and geometric data types. Two graph encodings of the road network – Segments-as-Nodes (SAN) and Segments-as-Edges (SAE) – are developed and evaluated alongside a traditional GIS model where road segments and trajectories are stored as relational tables with geometries. Using OpenStreetMap-derived road segments and linked trajectories, a benchmark suite of queries is designed to assess traversal performance, bidirectional queries, data manipulation operations (create, update, delete), and trajectory-focused queries such as finding paths and relationships between segments. The experimental results show that PostGIS generally matches or outperforms Apache AGE in most scenarios, especially for spatial and bidirectional queries, where AGE tends to produce inefficient relational execution plans. Bidirectional traversals and variable-length edge (VLE) queries can become significantly slower in AGE and may even fail or cause stability issues, for example during delete operations. The study also examines optimization techniques such as batching operations, filtering early in MATCH clauses, and partitioning the graph by geographic region, which reduce the number of comparisons and improve data loading and query throughput, although execution times remain somewhat variable. On the positive side, Apache AGE offers higher query expressiveness, and Cypher allows users to formulate relationship-centric and recursive queries more intuitively than standard SQL. Overall, the thesis concludes that GIS-based solutions are more efficient and robust for large-scale spatial data processing, whereas graph databases are particularly useful when the main concern is exploring relational patterns and graph traversals. The choice between the two paradigms should be guided by the workload, and a hybrid approach combining PostGIS and Apache AGE is highlighted as a promising direction for future work.
Denne afhandling undersøger, hvordan forskellige datarepræsentationer og databaseteknologier klarer sig, når der arbejdes med store mængder rumlige data og trajektoriedata for vejnet. Inden for samme PostgreSQL-database sammenlignes en grafbaseret tilgang med Apache AGE, som bygger på Labeled Property Graphs og Cypher-forespørgsler, med en klassisk GIS-tilgang baseret på PostGIS og geometriske datatyper. Der udvikles to grafrepræsentationer af vejnettet – Segments-as-Nodes (SAN) og Segments-as-Edges (SAE) – som sammenlignes med en traditionel GIS-model, hvor vejsegmenter og trajektorier er lagret som relationelle tabeller med geometrier. Med udgangspunkt i OSM-baserede vejsegmenter og tilknyttede trajektorier konstrueres et benchmarksæt af forespørgsler, der omfatter traversal- og bi‑direktionelle forespørgsler, oprettelse, opdatering og sletning af data samt trajektorierettede forespørgsler, fx til at finde stier og relationer mellem segmenter. Resultaterne viser, at PostGIS generelt matcher eller overgår Apache AGE i ydeevne, særligt for rumlige og bi‑direktionelle forespørgsler, hvor AGE ofte genererer ineffektive relationelle eksekveringsplaner. Bi‑direktionelle forespørgsler og variable længde‑kanter (VLE) kan blive markant langsommere i AGE og i nogle tilfælde fejle eller påvirke stabiliteten, bl.a. ved sletninger. Undersøgelsen evaluerer også optimeringsteknikker som batching, tidlig filtrering i MATCH‑udtryk og partitionering af data efter geografi, som kan reducere sammenligninger og forbedre indlæsnings- og forespørgselsydelse, om end eksekveringstiderne forbliver svingende. På den positive side giver Cypher-sproget i AGE en mere intuitiv og udtryksfuld måde at beskrive relationelle mønstre og rekursive traversaler på end klassisk SQL. Afhandlingen konkluderer, at GIS-baserede løsninger er mere effektive og robuste til storstilet rumlig databehandling, mens grafdatabaser er særligt attraktive, når fokus er på relationelle mønstre og graftraversering. Valget mellem teknologier bør derfor afhænge af arbejdsbelastningen, og der peges på hybride løsninger, der kombinerer PostGIS og Apache AGE, som et lovende emne for fremtidig forskning.
[This abstract has been generated with the help of AI directly from the project full text]
Keywords
Graph ; Apache AGE ; PostGIS
