AAU Student Projects - visit Aalborg University's student projects portal
A master's thesis from Aalborg University
Book cover


Analysis of the welding process sound using Convolutional Neural Networks for penetration state recognition

Authors

;

Term

4. term

Publication year

2020

Submitted on

Pages

28

Abstract

Robotic welding needs fast and reliable feedback. This study examines whether the sound from the welding arc can reveal weld penetration—that is, how deeply the molten pool enters the joint—and whether a neural network can detect it. The sound is converted into a spectrogram (a visual map of frequencies over time) using the short-time Fourier transform (STFT), and the spectrogram is fed to a convolutional neural network (CNN) that classifies it into one of three penetration states. Using a pre-recorded dataset, the study tests how different sampling strategies affect the network’s ability to generalize to new recordings, and how spectrogram preprocessing choices influence prediction accuracy. With the best combination of sampling and preprocessing, a custom CNN reaches an average test accuracy of 69.94% using 0.25 s audio clips.

Robotsvejsning har brug for hurtig og pålidelig feedback. Denne undersøgelse ser på, om lyden fra svejsebuen kan afsløre svejsens indbrænding, altså hvor dybt smeltebadet trænger ind i fugen. Lyden omdannes til et spektrogram (et visuelt kort over frekvenser over tid) ved hjælp af short-time Fourier transform (STFT), og spektrogrammet fødes til et konvolutionsneuronalt netværk (CNN), som klassificerer lyden i én af tre indbrændingstilstande. Med et forudoptaget datasæt undersøges det, hvordan forskellige strategier for udvælgelse af træningseksempler påvirker netværkets evne til at generalisere til nye optagelser. Derudover vurderes, hvordan valg af forbehandlingsparametre til spektrogrammet påvirker forudsigelsesnøjagtigheden. Med den bedste kombination af prøvetagningsstrategi og forbehandling opnår et skræddersyet CNN en gennemsnitlig testnøjagtighed på 69,94% baseret på 0,25 s lydklip.

[This apstract has been rewritten with the help of AI based on the project's original abstract]