AAU Student Projects - visit Aalborg University's student projects portal
A master's thesis from Aalborg University
Book cover


Binaural auditory model for audio quality assessment

Author

Term

4. term

Publication year

2012

Submitted on

Abstract

Lydkvalitet fylder stadig mere for brugere af lydudstyr, og producenter har derfor brug for pålidelige måder at vurdere kvaliteten. Lytteprøver er standarden, men de er tidskrævende og dyre; der er behov for en billigere metode uden at gå på kompromis med nøjagtigheden. Mange objektive beregningsmodeller, som skal forudsige lydkvalitet, fokuserer kun på monofon opfattelse (én kanal/ét øre) og kan derfor undervurdere rumlige forringelser (problemer med oplevelsen af retning og rum). Projektets mål var at udvikle – med udgangspunkt i eksisterende perceptuelle modeller – en binaural model (to ører) til at vurdere forringelser i lydkvalitet, både rumlige og ikke-rumlige. Én monofon model (CASP) og tre forskellige binaurale processorer blev overvejet. En lytteprøve blev gennemført for at validere de kombinerede objektive modeller, justere deres parametre og optimere deres forudsigelser. Til sidst blev den kombination af modeller og parametre, der virkede mest optimal, valgt. Der er dog stadig områder, der kræver yderligere undersøgelse, hvis man skal nå frem til en virkelig optimal og let anvendelig model.

Audio quality matters increasingly to users of audio equipment, so manufacturers need reliable ways to assess it. Listening tests are the gold standard but are costly and time-consuming; there is a need for a more affordable method without sacrificing accuracy. Many objective computational models that predict audio quality focus only on monophonic perception (single channel/one ear), which can miss spatial degradations (issues with the sense of direction and space). This project aimed to develop, based on existing perceptual models, a binaural (two-ear) model of auditory perception that can assess both spatial and non-spatial quality degradations. One monophonic model (CASP) and three different binaural processors were considered. A listening test was conducted to validate the combined objective models, adjust their parameters, and optimize their predictions. Finally, the combination of models and parameters that appeared most optimal was selected. However, further work is needed to achieve a truly optimal and easy-to-use model.

[This abstract was generated with the help of AI]