AAU Student Projects - visit Aalborg University's student projects portal
A master's thesis from Aalborg University
Book cover


A New Grid Manager for NorduGrid – A Transitional Path

Authors

;

Term

4. term

Publication year

2005

Abstract

Denne afhandling præsenterer design, implementering og evaluering af en ny grid‑manager til NorduGrid‑middleware. NorduGrid er et grid‑computing‑projekt, der forbinder mere end 50 klynger og omkring 5.000 CPU’er for at køre opgaver på tværs af mange lokationer. En grid‑manager er den komponent, der planlægger og overvåger opgaver og koordinerer ressourcer. Den nuværende NorduGrid‑manager er rigid og svær at udvide, derfor introduceres en plugin‑baseret, hændelsesdrevet arkitektur (komponenter reagerer på hændelser), som gør det muligt at tilføje nye funktioner modulært. Arkitekturen er implementeret i Python og bruges til at bygge en prototype, der kan fungere som drop‑in‑erstatning for den nuværende manager, så den kan indføres uden ændringer i resten af systemet. For at teste udvidelsesmulighederne undersøger afhandlingen flere avancerede anvendelsesscenarier og beskriver, hvordan de kan realiseres i den nye arkitektur. Evalueringen viser, at den nye manager er udvidelig, effektiv og kan tilpasses. Afhandlingen skitserer også tilgange til at forbedre fejltolerance, så systemet bliver mere robust over for fejl.

This thesis presents the design, implementation, and evaluation of a new grid manager for the NorduGrid middleware. NorduGrid is a grid computing project that connects more than 50 clusters and around 5,000 CPUs to run jobs across many locations. A grid manager is the component that schedules and monitors jobs and coordinates resources. The existing NorduGrid manager is rigid and hard to extend, so we introduce a plugin‑based, event‑driven architecture (components react to events) that enables modular addition of new features. The architecture is implemented in Python and used to build a prototype that can serve as a drop‑in replacement for the current manager, easing adoption without changes to the surrounding system. To assess extensibility, the thesis examines several advanced use cases and explains how each can be achieved within the new architecture. The evaluation indicates that the new manager is extensible, efficient, and customizable. The thesis also outlines approaches to improve fault tolerance, making the system more resilient to failures.

[This abstract was generated with the help of AI]