AAU Student Projects - visit Aalborg University's student projects portal
A master's thesis from Aalborg University
Book cover


HRHUB: A Bilateral Job Posting Enriched Semantic Matching System for Recruitment

Authors

; ; ;

Term

1. semester

Publication year

2025

Submitted on

Pages

45

Abstract

Automatiserede systemer bruges i stigende grad i rekruttering, men mange løsninger er ineffektive: de filtrerer primært ud fra virksomheders behov, matcher på nøgleord frem for betydning og skaber en dyr AI-mod-AI-dynamik, hvor både virksomheder og kandidater bruger værktøjer til at optimere mod hinanden. Dette semesterprojekt præsenterer HRHUB, et tosidet, semantisk matchingssystem, der ser rekruttering som en afstemning af både virksomheders behov og kandidaters profiler med jobopslaget som fælles reference. Systemet skaber et fælles repræsentationsrum (embedding), hvor tekst om krav og kompetencer omdannes til numeriske beskrivelser af betydning, så behov og tilbud kan sammenlignes på meningsniveau frem for kun på ord. Målet er at reducere unødigt screeningsarbejde ved at understøtte mere målrettede og kontekstbevidste match og dermed fremme et mere effektivt og innovativt arbejdsmarked. HRHUB bruger fortrænede sætnings-embeddings til zero-shot semantisk matching, det vil sige modeller der kan forstå sætningers betydning uden at blive trænet specifikt til hver jobtype. Jobopslag beriges, så relevante færdigheder og kontekst, som nøgleordsmetoder ofte misser, bliver eksplicitte. Løsningen er implementeret som en end-to-end arbejdsgang fra dataindsamling og tekstkonstruktion til embeddinggenerering, lighedsmatching og visualisering. Et forklaringslag genererer menneskeligt læsbare begrundelser for match og fungerer som beslutningsstøtte frem for erstatning for menneskelig vurdering. Ud over at optimere den umiddelbare rekruttering viser HRHUB, hvordan semantiske, tosidede match kan gøre nye AI-drevne rekrutteringsprocesser mere gennemsigtige og skalerbare og give indsigt i kompetencefordelinger og matchadfærd i et arbejdsmarked præget af automatisering. Systemet er evalueret via baseline-sammenligninger med nøgleordsmetoder (TF-IDF, Jaccard), dækningsmål og menneskelig validering, hvilket giver kvalitative indsigter i oplevet matchrelevans og systemadfærd. Projektet bidrager med en praktisk og forklarlig ramme for tosidet, jobopslag-beriget semantisk matching, der adresserer både aktuelle ineffektiviteter og langsigtede arbejdsmarkedsudfordringer i en AI-drevet økonomi.

Automated tools are increasingly used in hiring, but many current solutions are inefficient: they filter mainly for employers’ needs, rely on keywords instead of meaning, and create a costly AI-versus-AI dynamic in which companies and candidates optimize against each other. This semester project presents HRHUB, a two-sided, meaning-based matching system that treats recruitment as aligning both employer requirements and candidate profiles, using the job posting as a shared reference. The system builds a shared representation space (an embedding) that turns text about requirements and skills into numerical meaning, allowing needs and offerings to be compared at the level of meaning rather than just words. The goal is to reduce redundant screening by supporting more targeted, context-aware matches, and thereby foster a more efficient and innovative labor market. HRHUB uses pre-trained sentence embeddings for zero-shot semantic matching—that is, models that capture sentence meaning without training for each specific job type. Job postings are enriched to make relevant skills and context explicit, addressing gaps that keyword methods often miss. The solution is implemented as an end-to-end workflow from data ingestion and text construction to embedding generation, similarity matching, and visualization. An explainability layer produces human-readable reasons for each match, positioning the system as decision support rather than a replacement for human judgment. Beyond immediate recruitment optimization, HRHUB shows how semantic, two-sided matching can make emerging AI-driven recruitment workflows more transparent and scalable and provide insight into skill distributions and matching behavior as automation reshapes labor markets. The system is evaluated through baseline comparisons with keyword methods (TF-IDF, Jaccard), coverage metrics, and human validation, offering qualitative insights into perceived match relevance and system behavior. The project contributes a practical and explainable framework for two-sided, job-posting-enriched semantic matching that addresses both current inefficiencies and long-term labor market challenges in an AI-driven economy.

[This summary has been rewritten with the help of AI based on the project's original abstract]