AAU Student Projects - visit Aalborg University's student projects portal
A master's thesis from Aalborg University
Book cover


Minimal-Control DSP for Mix-Bus Processing

Author

Term

4. Term

Publication year

2025

Submitted on

Pages

126

Abstract

This thesis explores how established digital signal processing (DSP) techniques can be adapted and integrated into a task‑specific, real‑time plugin for the mix bus (the final stereo output) aimed at non‑technical users. The premise is that while the literature describes individual modules well (e.g., compression, clipping, equalization), it rarely situates them within the constraints and workflow of a coherent mix‑bus tool. Accordingly, the review focused on audio venues (DAFx, AES) and was supplemented with commercial case analyses to stay close to real‑time plugin practice. Based on this, we built a fixed‑chain prototype that combines: (i) a feed‑forward compressor with branched peak/RMS detection, governed by a single Bias macro so users can tilt behavior toward peak or average‑level response; (ii) a broad‑stroke, fixed‑band EQ with a touch of difference‑signal saturation (adding gentle harmonics without blurring the center); (iii) a stereo widener that boosts high‑frequency side energy and adds a constrained ambience path; and (iv) a hybrid maximizer that applies ADAA‑based clipping only to brief transient overshoots ahead of a look‑ahead limiter (a limiter that reacts slightly in advance). To reduce digital artifacts (aliasing), the design combines whole‑chain oversampling with local ADAA in the clipper. Evaluation used a five‑minute rough‑mix task in Logic Pro (three stems; processing restricted to the plugin) with eleven non‑technical participants, followed by NASA–TLX, the SUS usability scale, and post‑test interviews. SUS averaged 80.2 (rated “excellent”), with scores from 65 to 92.5. NASA–TLX indicated workload dominated by time pressure (weighted ≈54.8), with mental demand, effort, performance, and frustration at moderate levels. Qualitative feedback highlighted the compressor and width control as especially intuitive; the EQ’s sound was praised, though some users felt its GUI placement was secondary; the widener benefited from a slightly tighter upper range; and the maximizer was valued conceptually but could produce pumping under heavy gain reduction. The contribution is twofold: (1) an architectural framework that adapts and integrates established DSP algorithms specifically for the mix‑bus context, and (2) empirical evidence that simplified, macro‑level controls can still support musically meaningful decision‑making by non‑experts under time constraints. Limitations include the small participant sample and the prototype’s basic metering and visual feedback. The results suggest that DSP choices, the degree of simplification, and evaluation methods should be shaped by the specific demands of the mix‑bus task rather than treated as separate algorithmic problems.

Denne afhandling undersøger, hvordan etablerede teknikker i digital signalbehandling (DSP) kan tilpasses og samles i et opgavespecifikt realtids‑plugin til mix‑bussen (den fælles stereo‑udgang) målrettet ikke‑tekniske brugere. Udgangspunktet er, at litteraturen beskriver enkelte moduler godt (fx kompression, clipping og equalizere), men sjældent forankrer dem i en samlet mix‑bus‑værktøj med konkrete arbejdsgange og begrænsninger. Derfor blev litteraturgennemgangen forankret i audio‑konferencer (DAFx, AES) og suppleret med analyser af kommercielle produkter for at holde fokus på praksis i realtids‑plugins. På dette grundlag implementeres en prototype med fast kæde, der kombinerer: (i) en feed‑forward kompressor med forgrenet peak/RMS‑detektering, styret af en enkelt Bias‑makro, som lader brugeren vippe mellem at reagere på spidser eller gennemsnitsniveau; (ii) en grovstrøget EQ med faste bånd, suppleret med let mætning af differenssignalet (tilføjer diskrete overtoner uden at sløre midten); (iii) en stereo‑udvider, der øger sideenergi i de høje frekvenser og tilføjer en kontrolleret ambience‑vej; og (iv) en hybrid maksimer, der kun klipper korte transiente overskridelser ved hjælp af ADAA (en metode til at reducere aliasing) før en look‑ahead limiter (en begrænser, der kan forudse spidser). For at begrænse aliasing anvendes oversampling i hele kæden og lokal ADAA i clipperen. Evalueringen bestod af en fem minutters rough‑mix‑opgave i Logic Pro (tre stems; al behandling via plugin'et) med elleve ikke‑tekniske deltagere, efterfulgt af NASA–TLX, SUS og eftertest‑interviews. SUS havde et gennemsnit på 80,2 (klassificeret som "excellent"), med scores fra 65 til 92,5. NASA–TLX viste, at arbejdsbelastningen især var præget af tidskrav (vægtet ≈54,8), mens mental belastning, indsats, præstation og frustration lå på moderate niveauer. Kvalitativ feedback vurderede kompressoren og breddekontrollen som særligt intuitive; EQ'ens lyd blev rost, men nogle brugere fandt dens placering i grænsefladen mindre fremtrædende; wideneren havde gavn af en lidt strammere øvre rækkevidde; og maksimeren blev værdsat konceptuelt, men kunne give en pumpende effekt ved kraftig reduktion. Afhandlingens bidrag er: (1) et arkitektonisk rammeværk, der tilpasser og integrerer etablerede DSP‑algoritmer specifikt til mix‑bus‑konteksten, og (2) empirisk evidens for, at forenklede makro‑kontroller stadig kan understøtte musikalsk meningsfulde beslutninger hos ikke‑eksperter under tidspres. Begrænsninger omfatter det lille deltagerantal samt prototypens enkle måling og visuelle feedback. Resultaterne peger på, at valg af DSP, graden af forenkling og evalueringsmetoder bør formes af mix‑bus‑opgavens specifikke krav frem for at blive behandlet som isolerede, algoritmiske problemer.

[This apstract has been rewritten with the help of AI based on the project's original abstract]

Keywords