DBLint: A Tool for Automated Analysis of Database Design
Authors
Weisberg, Andreas ; Krogh, Benjamin ; Bested, Morten
Term
4. term
Education
Publication year
2011
Submitted on
2011-06-06
Pages
28
Abstract
Manual reviews of database design are time‑consuming and error‑prone. This thesis presents DBLint, a fast, configurable, and DBMS‑independent tool for automated analysis of database schemas aimed at ensuring quality and consistency. DBLint implements 46 design rules derived from good practices, known antipatterns, and practical experience, combining both metadata and data analysis. Rules categorize findings into four severity levels and present them in an interactive report; additionally, per‑table and overall scores are computed based on issue severity, location in the schema, and a table‑importance measure. The system requires minimal configuration, supports extensible rules (including automatic discovery of naming conventions), and works across multiple DBMSs, including MySQL, Oracle, PostgreSQL, and SQL Server. DBLint was evaluated on more than 35 real‑world schemas, including a comparison of 14 widely used schemas, and developers from four organizations reported it useful—especially the overall score and report—while it identified many relevant issues. The work contributes a experimentally validated rule set, a pluggable rule system, and a quantifiable 0–100% scoring of schema quality that can be used during development (e.g., as part of unit tests) and in production to surface data quality problems.
Manuelle reviews af databasedesign er tidskrævende og fejlbehæftede. Denne afhandling præsenterer DBLint, et hurtigt, konfigurerbart og DBMS-uafhængigt værktøj til automatiseret analyse af databaseskemaer, der har til formål at sikre kvalitet og konsistens. DBLint implementerer 46 designregler afledt af god praksis, kendte antipatterns og praktisk erfaring og kombinerer både metadata- og dataanalyse. Reglerne opdeler fund i fire alvorlighedsniveauer og præsenterer dem i en interaktiv rapport; derudover beregnes en score for hver tabel og en samlet databasescore baseret på alvorlighed, placering i skemaet og et tabelvigtighedsmål. Systemet kræver minimal konfiguration, kan udvides med nye regler (bl.a. automatisk detektion af navngivningskonventioner) og understøtter flere DBMS’er, herunder MySQL, Oracle, PostgreSQL og SQL Server. DBLint er evalueret på mere end 35 virkelige skemaer, herunder en sammenligning af 14 udbredte skemaer, og udviklere fra fire organisationer vurderede værktøjet som nyttigt—særligt den samlede score og rapporten—og det identificerede mange relevante problemer. Arbejdet bidrager med en eksperimentelt valideret regelsamling, et pluggable regelsystem og en målbar vurdering af skemakvalitet, som kan bruges i både udvikling (fx som enhedstest) og drift til at finde datakvalitetsproblemer.
[This apstract has been generated with the help of AI directly from the project full text]
Other projects by the authors
Weisberg, Andreas:
Krogh, Benjamin:
Bested, Morten:
