A Generic Backend for Fast Au-
Author
Skovsgaard, Anders
Term
4. term
Education
Publication year
2008
Abstract
Denne afhandling beskriver udviklingen af en generisk backend, der kan finde det bedste match for lydfingeraftryk. Lydfingeraftryk er kompakte digitale signaturer af et lydklip og kan komme fra forskellige generatorer og fra lydkilder, der er påvirket af støj. Matchningen afgøres af en score, som afhænger af antallet af korrekt placerede n-grammer (korte sekvenser) i fingeraftrykkene. For at gøre opslag hurtigt bruger algoritmen n-grammer og hashtabeller (en datastruktur til effektive opslag). Derudover udvikles et lighedsmål, som hurtigt udvælger et kandidatsæt: en mindre delmængde af fingeraftryk i databasen, der vurderes som mulige matches. Søgealgoritmen garanterer ingen falske afvisninger (dvs. at korrekte matches ikke forkastes), og parametre kan justeres for at ændre resultaternes pålidelighed. Eksperimentelle præstationsstudier viser, at løsningen er størrelsesordener hurtigere end beslægtede metoder.
This thesis presents a general-purpose backend that finds the best match for audio fingerprints. Audio fingerprints are compact digital signatures of a recording and can come from different generators and from audio sources affected by noise. The best match is determined by a score based on how many n-grams (short sequences) are correctly aligned in the fingerprints. To enable fast search, the algorithm uses n-grams and hash tables (a data structure for quick lookups). In addition, a similarity measure is introduced to quickly form a candidate set: a smaller subset of database fingerprints estimated to be possible matches. The search algorithm guarantees no false dismissals (meaning true matches are not rejected), and parameters can be tuned to adjust the reliability of the results. Experimental performance studies show that the solution is orders of magnitude faster than related work.
[This abstract was generated with the help of AI]
Documents
