AAU Student Projects - visit Aalborg University's student projects portal
A master's thesis from Aalborg University
Book cover


CSGCN - Context and Side-Information in GCNs

Authors

; ;

Term

4. term

Education

Publication year

2021

Submitted on

Pages

22

Abstract

Graf-konvolutionelle neurale netværk (GCN’er) bliver stadig mere udbredte i anbefalingssystemer, men de fleste bruger kun bruger–vare-interaktioner, selv om datasæt ofte også indeholder ekstra oplysninger som kontekst og sideinformation. GCN’er er modeller, der lærer fra grafer (netværk), her mellem brugere og varer. I denne afhandling præsenterer vi to måder at indarbejde kontekst og sideinformation i en GCN: CSGCN-IS og CSGCN-ADJ. Med kontekst mener vi omstændighederne omkring en interaktion, og med sideinformation mener vi yderligere egenskaber eller metadata. Ved at inddrage disse oplysninger kan vi både øge grafens sammenhæng (tæthed) og generere anbefalinger, der passer til den situation, brugeren befinder sig i. Vi evaluerer modellerne både i en kontekstspecifik og en ikke-kontekstspecifik opsætning på fire virkelige datasæt og sammenligner med flere relevante GCN- og FM-modeller. I den ikke-kontekstspecifikke evaluering, med en 80/20 fordeling mellem trænings- og testdata, finder vi forbedringer fra 0,07 % til 10,01 %, men også fald på op til 5,09 % på visse datasæt. Den kontekstspecifikke evaluering viser både markante forbedringer og markante fald. En ablationsundersøgelse viser desuden, at det for CSGCN-ADJ kun i ringe grad hjælper at tilføje kontekst og sideinformation i den ikke-kontekstspecifikke opsætning. I den kontekstspecifikke opsætning stiger CSGCN-IS’ ydeevne, når kontekst og sideinformation medtages, mens CSGCN-ADJ ændrer sig meget lidt.

Graph-convolutional neural networks (GCNs) are increasingly popular in recommendation systems, but most rely only on user–item interactions, even when datasets also contain extra signals such as context and side information. GCNs are models that learn from graphs (networks), here linking users and items. This thesis presents two ways to integrate context and side information into a GCN: CSGCN-IS and CSGCN-ADJ. By context we mean the circumstances of an interaction, and by side information we mean additional attributes or metadata. Including this information can both increase the graph’s connectivity (density) and enable recommendations tailored to the user’s current situation. We evaluate both models in context-specific and non-context-specific settings on four real-world datasets, and we compare them with several relevant GCN and FM models. In the non-context setting, using an 80/20 train–test split, we observe performance gains from 0.07% up to 10.01%, as well as decreases up to 5.09% on some datasets. The context-specific evaluation shows both notable improvements and notable drops. An ablation study further shows that, in the non-context setting, adding context and side information to CSGCN-ADJ yields little benefit. In the context-specific setting, CSGCN-IS performs better when context and side information are included, while CSGCN-ADJ changes very little.

[This summary has been rewritten with the help of AI based on the project's original abstract]