AAU Student Projects - visit Aalborg University's student projects portal
A master's thesis from Aalborg University
Book cover


RelaXML - a Tool for Transferring Data between Relational Databases and XML Files

Authors

;

Term

4. term

Publication year

2004

Abstract

This thesis presents RELAXML, a platform-independent tool for transferring data between relational databases and XML files. The tool addresses the need to export well-defined subsets of data to a vendor-neutral format and later reimport updated documents, including into compatible empty databases. Users can specify the XML structure and apply flexible transformations during export and import—such as encrypting sensitive values or converting units—and RELAXML can delete database records based on XML content. When importing updated XML, the tool ensures consistent updates of redundant data without requiring users to indicate which values changed. RELAXML is built on SAX technology to handle large files. The thesis provides formal descriptions of export, import, and delete operations alongside design and implementation details. A performance study shows good results, with an overhead of approximately 100% compared to direct SQL via JDBC. The main contributions are guarantees about reimportability established at export time and highly flexible data transformations for both export and import.

Denne afhandling præsenterer RELAXML, et platformuafhængigt værktøj til at overføre data mellem relationelle databaser og XML-filer. Værktøjet adresserer behovet for at eksportere veldefinerede datasæt til et leverandøruafhængigt format og efterfølgende kunne genimportere opdaterede dokumenter, også til kompatible, tomme databaser. Brugeren kan selv specificere XML-strukturen og anvende fleksible transformationer under eksport og import, eksempelvis kryptering af følsomme data eller enhedskonvertering, og RELAXML kan slette data i databasen baseret på XML-indhold. Ved import af opdateret XML sikrer værktøjet konsistent opdatering af redundante data, uden at brugeren skal angive, hvilke værdier der er ændret. RELAXML er baseret på SAX-teknologi og kan håndtere store filer. Afhandlingen giver formelle beskrivelser af eksport-, import- og sletteoperationer samt design- og implementeringsdetaljer. En ydeevnestudie viser god performance med en overhead på cirka 100% sammenlignet med direkte SQL via JDBC. De primære bidrag er garanti for importmulighed allerede ved eksporttid og meget fleksible transformationer af data ved både eksport og import.

[This apstract has been generated with the help of AI directly from the project full text]