AAU Student Projects - visit Aalborg University's student projects portal
A master's thesis from Aalborg University
Book cover


Regenerative Braking System with Smart Energy Recovery

Authors

;

Term

4. term

Publication year

2026

Submitted on

Pages

177

Abstract

This thesis develops and evaluates a Reinforcement Learning (RL) controller for regenerative braking in a battery-electric vehicle. The RL agent acts as a torque-split controller that decides how to share braking between the motor’s energy recovery and the friction brakes, under the same physical constraints as a rule-based baseline. A simplified, HPPC-inspired State-of-Power (SoP) estimator provides a dynamic limit on how much charging power the battery can safely accept, allowing the agent to learn that power limits vary over time. The controller is a Deep Deterministic Policy Gradient (DDPG) agent trained in a Simulink simulation of an electric drivetrain. The reward function encourages effective use of SoP-limited regeneration and penalizes both constraint violations and abrupt control changes. Across different drive cycles and battery state-of-charge levels, the RL controller consistently shows strong performance, despite very limited training data and time. These results suggest that RL is a promising basis for future adaptive energy-management strategies.

Dette speciale udvikler og evaluerer en Reinforcement Learning (RL)-baseret styring af regenerativ bremsning i et batterielektrisk køretøj. RL-agenten fungerer som en momentfordeler, der bestemmer, hvor meget bremsemoment der skal komme fra elmotorens energigenvinding, og hvor meget der skal håndteres af friktionsbremserne, under de samme fysiske begrænsninger som en regelbaseret reference. En forenklet, HPPC-inspireret State-of-Power (SoP)-estimator giver en dynamisk grænse for, hvor meget ladeeffekt batteriet kan modtage, så agenten kan lære, at batteriets effektgrænser ændrer sig over tid. Agenten er en Deep Deterministic Policy Gradient (DDPG)-model, der trænes i et Simulink-simuleringsmiljø med en modelleret eldrivlinje. Belønningsfunktionen tilskynder til effektiv udnyttelse af den SoP-begrænsede regenerative kapacitet og straffer både overskridelser af fysiske begrænsninger og pludselige styreændringer. På tværs af forskellige kørselscykler og ladetilstande (State of Charge) viser RL-styringen konsekvent stærk ydeevne, selv om træningsdata og -tid er stærkt begrænsede. Resultaterne peger på, at RL kan være et lovende fundament for fremtidige, adaptive energistyringsstrategier.

[This apstract has been rewritten with the help of AI based on the project's original abstract]