TAX – Another Approach Sentimental Analysis
Translated title
SKAT - Alternativ tilgang til Sentimental Analyse
Authors
Andersen, Kim Bernhard ; Hansen, Jesper Puggaard
Term
4. term
Education
Publication year
2013
Submitted on
2013-06-12
Pages
57
Abstract
Dette projekt undersøger, om vi automatisk kan afgøre, om et dansksproget dokument udtrykker en positiv, negativ eller neutral tone (sentiment). Vi vurderer systemets ydeevne med præcision, et standardmål for hvor præcise forudsigelserne er. Vi bygger videre på Li & Liu (2012), en klyngebaseret metode, der grupperer lignende dokumenter. Vores model bruger egenskaber som unigrammer (enkeltord) og negation (fx "ikke"). Vi udvider tilgangen og afprøver forskellige beregningsmetoder, kombinationer af egenskaber og forskellige antal klynger. Resultaterne tyder på en forbedring i præcision på 10–15% sammenlignet med klyngebaselinen fra Li & Liu (2012). En begrænsning er, at præcisionen påvirkes af kvaliteten af de dokumenter, der bruges til at mærke klyngerne, hvilket er en ulempe ved denne tilgang.
This project examines whether we can automatically determine if a Danish-language document expresses a positive, negative, or neutral tone (sentiment). We evaluate performance using precision, a standard measure of prediction quality. Our approach builds on Li & Liu (2012), a cluster-based method that groups similar documents. Our model uses features such as unigrams (single words) and markers of negation (e.g., "not"). We extend this approach and test different calculation methods, feature combinations, and numbers of clusters. The results suggest a 10–15% improvement in precision compared with the Li & Liu (2012) cluster baseline. However, performance is affected by the quality of the documents used to label the clusters, which is a drawback of this approach.
[This abstract was generated with the help of AI]
Keywords
Documents
