AAU Student Projects - visit Aalborg University's student projects portal
A master's thesis from Aalborg University
Book cover


Learning Network Features: Link Prediction Framework for Bigraphs

Author

Term

4. term

Publication year

2017

Submitted on

Pages

18

Abstract

At forudsige hvilke forbindelser der sandsynligvis vil opstå i et netværk kræver ofte håndbyggede egenskaber (features) og specialistviden, og mange eksisterende løsninger er tæt bundet til et bestemt domæne. Netværksembedding tilbyder en anden tilgang: hver node i et netværk omsættes til en kompakt numerisk repræsentation, og fremskridt inspireret af naturlig sprogbehandling har gjort disse repræsentationer mere effektive. Vi udnytter denne udvikling til at lære egenskaber direkte fra strukturen i bipartite netværk (to adskilte mængder af noder, hvor forbindelser kun går på tværs) og skræddersyr dem til forudsigelse af links. Vi introducerer et nyt algoritmisk rammeværk, der tilpasser nyere embedding-metoder til bipartite netværk med det formål at forudsige links. Rammeværket kan anvendes i enhver sammenhæng, der kan beskrives som et bipartit netværk. I vores undersøgelser overgår det tidens førende metoder til linkforudsigelse. Ud over højere præcision er rammeværket modulært og skalerbart, og det giver som biprodukt genanvendelige node-embeddings, der kan bruges i andre maskinlæringsopgaver.

Predicting which connections are likely to appear in a network often depends on hand-crafted features and specialist knowledge, and many current solutions are tightly tailored to specific domains. Network embedding offers another route: it turns each node into a compact numerical representation, and recent advances inspired by natural language processing have made these representations more effective. We build on this progress to learn features directly from the structure of bipartite networks (two distinct sets of nodes where connections run across sets) and tailor them for link prediction. We introduce a new algorithmic framework that adapts recent embedding methods to bipartite networks for the purpose of predicting links. The framework applies to any problem that can be cast as a bipartite network. In our studies, it outperforms state-of-the-art link prediction techniques. Beyond higher precision, it is modular and scalable, and it produces reusable node embeddings that can support other machine learning tasks.

[This abstract was generated with the help of AI]