Multi-level Deep Models for Forum Sentiment Classification
Authors
Nesgaard, Emil Alexander Lousdahl ; Fogh, Peter
Term
4. term
Education
Publication year
2017
Submitted on
2017-06-09
Pages
80
Abstract
Målspecifik sentimentklassifikation handler om at vurdere, hvilken holdning en tekst udtrykker over for et bestemt mål, for eksempel et navngivet kosttilskud eller en behandling. Det meste arbejde på området er lavet på tweets, men forumtråde er en anden vigtig type data, især når kræftpatienter deler erfaringer med kosttilskud i forbindelse med deres behandling. Sådan viden kan hjælpe andre brugere, som søger at forbedre deres situation. Vi foreslår tre LSTM-baserede metoder (en type neuralt netværk, der er velegnet til tekster i rækkefølge), der er designet til at afspejle den naturlige hierarki i forumtråde: ord hører til i indlæg, og indlæg hører til i tråde. Modellerne vurderer sentiment over for et givent mål ved både at bruge ordniveau-kontekst og indlægsniveau-kontekst. Hver model griber hierarkiet an på en lidt forskellig måde, undersøger samspillet mellem ord- og dokumentindlejringer (vektorrepræsentationer af tekst), og afprøver om brug af flere labels samt forskellige tabsfunktioner kan forbedre ydeevnen. For at evaluere modellerne har vi manuelt annoteret tråde fra flere kræftrelaterede fora. De første resultater viser, at vores design har potentiale, og at modellerne med mere data sandsynligvis vil kunne overgå tidligere tilgange.
Target-dependent sentiment classification aims to determine the attitude expressed toward a specific target in text, such as a named supplement or treatment. Most prior work focuses on tweets, but forum threads are another valuable source, especially where cancer patients share experiences with supplements alongside their treatment. Insights from such forums may help others seeking to improve their situation. We introduce three LSTM-based methods (a type of neural network suited to sequences) that model the natural hierarchy of forum threads: words within posts, and posts within threads. The models estimate sentiment toward a given target by using both word-level and post-level context. Each model captures this hierarchy in a different way, explores how to combine word and document embeddings (numeric representations of text), and tests whether using multiple labels and different loss functions can improve performance. To evaluate our approach, we manually annotated threads from several cancer-related forums. Early results indicate that our designs are promising, and that with more data the models may be able to outperform previous methods.
[This abstract was generated with the help of AI]
Keywords
Documents
