AAU Student Projects - visit Aalborg University's student projects portal
A master's thesis from Aalborg University
Book cover


DBLint: A Tool for Automated Analysis of Database Design

Authors

; ;

Term

3. term

Education

Publication year

2011

Submitted on

Pages

33

Abstract

Manuel vurdering af et databaseskema (strukturen i en database med tabeller og relationer) er tidskrævende, fejlbehæftet og kræver overblik. Vi præsenterer DBLint, et værktøj der automatisk analyserer database-design ud fra 25 designregler, som indfanger god praksis. Arkitekturen er let at udvide, så nye regler kan tilføjes. DBLint omfatter flere komponenter til en grundig analyse: det bruger PageRank (en rangeringsalgoritme kendt fra websøgning) til at finde centrale tabeller, en visualisering der giver et overskueligt overblik, samt automatisk afdækning og kontrol af navngivningskonventioner. Værktøjet beregner desuden en samlet score, der opsummerer kvaliteten af skemaet. DBLint er implementeret og afprøvet på et stort sæt udbredte databaseskemaer, hvor der blev fundet mange designproblemer. En evaluering af fundene bekræftede, at de 25 regler peger på relevante problemer. To database-designteams testede DBLint og gav positiv feedback og forslag til værktøjet.

Manually reviewing the quality of a database schema (the structure of a database—its tables and relationships) is time-consuming, error-prone, and requires a good overview. We present DBLint, a tool that automatically analyzes database design using 25 rules that capture good practices. The architecture is highly extensible, so new rules can be added easily. DBLint includes components for thorough analysis: it uses PageRank (a ranking algorithm known from web search) to identify central tables, a visualization that offers an easy-to-read overview of the schema, and automatic discovery and checking of naming conventions. The tool also provides an overall score summarizing the schema’s quality. DBLint has been implemented and evaluated on a large set of widely used database schemas, where it identified numerous design issues. An evaluation of the findings confirmed that the 25 rules surface relevant problems. Two database design teams tried DBLint and provided positive feedback and suggestions for the tool.

[This abstract was generated with the help of AI]