Learning Network Features: Link Prediction Framework for Bigraphs

Author

Thruesen, Philip

Term

4. term

Education

Machine Intelligence, Master

Publication year

2017

Submitted on

2017-06-02

Pages

Abstract

Predicting which connections are likely to appear in a network often depends on hand-crafted features and specialist knowledge, and many current solutions are tightly tailored to specific domains. Network embedding offers another route: it turns each node into a compact numerical representation, and recent advances inspired by natural language processing have made these representations more effective. We build on this progress to learn features directly from the structure of bipartite networks (two distinct sets of nodes where connections run across sets) and tailor them for link prediction. We introduce a new algorithmic framework that adapts recent embedding methods to bipartite networks for the purpose of predicting links. The framework applies to any problem that can be cast as a bipartite network. In our studies, it outperforms state-of-the-art link prediction techniques. Beyond higher precision, it is modular and scalable, and it produces reusable node embeddings that can support other machine learning tasks.

At forudsige hvilke forbindelser der sandsynligvis vil opstå i et netværk kræver ofte håndbyggede egenskaber (features) og specialistviden, og mange eksisterende løsninger er tæt bundet til et bestemt domæne. Netværksembedding tilbyder en anden tilgang: hver node i et netværk omsættes til en kompakt numerisk repræsentation, og fremskridt inspireret af naturlig sprogbehandling har gjort disse repræsentationer mere effektive. Vi udnytter denne udvikling til at lære egenskaber direkte fra strukturen i bipartite netværk (to adskilte mængder af noder, hvor forbindelser kun går på tværs) og skræddersyr dem til forudsigelse af links. Vi introducerer et nyt algoritmisk rammeværk, der tilpasser nyere embedding-metoder til bipartite netværk med det formål at forudsige links. Rammeværket kan anvendes i enhver sammenhæng, der kan beskrives som et bipartit netværk. I vores undersøgelser overgår det tidens førende metoder til linkforudsigelse. Ud over højere præcision er rammeværket modulært og skalerbart, og det giver som biprodukt genanvendelige node-embeddings, der kan bruges i andre maskinlæringsopgaver.

[This apstract has been rewritten with the help of AI based on the project's original abstract]

Keywords

link prediction ; feature learning ; network embedding

Documents

Download PDF
View record in AAU Student Projects

A master's thesis from Aalborg University

Learning Network Features: Link Prediction Framework for Bigraphs