AAU Student Projects - visit Aalborg University's student projects portal
A master's thesis from Aalborg University
Book cover


Measures of semantic similarity in folksonomies

Author

Term

4. term

Publication year

2010

Abstract

Folksonomier er brugerdrevne måder at klassificere online indhold på og en vigtig del af Web 2.0. Fordi de bygger på mange menneskers betegnelser, kan de følge med internettets hurtige vækst. Når der findes tilstrækkelige mængder data, kan folksonomier analyseres og bruges på forskellige måder. Denne afhandling fokuserer på semantisk lighed i folksonomier (metoder der kvantificerer, hvor tæt i betydning to elementer eller betegnelser er). Vi evaluerer flere mål for semantisk lighed på datasæt fra delicious.com, Last.fm og medworm.com. Til evaluering anvendes referencedata fra WordNet, Open Directory Project og en medicinsk ontologi. Resultaterne indikerer, at mål for semantisk lighed med succes kan fange meningsfulde ligheder i folksonomier på tværs af domæner, blandt andet inden for musik og websider.

Folksonomies are user-driven ways of classifying online content and a key part of Web 2.0. Because they rely on many people to supply labels, they can keep pace with the rapid growth of the web. When enough data is available, folksonomies can be analyzed and used in various ways. This thesis focuses on semantic similarity in folksonomies (methods that quantify how close in meaning two items or labels are). We evaluate several semantic similarity measures on datasets from delicious.com, Last.fm, and medworm.com. For evaluation, we use grounding data from WordNet, the Open Directory Project, and a medical ontology as reference points. The results indicate that semantic similarity measures can successfully capture meaningful similarities within folksonomies across domains, including music and web pages.

[This abstract was generated with the help of AI]