Video Animation of People from RGBD Dat
Author
Thomsen, Cathrine Juel
Term
4. term
Publication year
2016
Submitted on
2016-06-02
Abstract
This thesis explores a low-cost approach to animating people from RGB-D video using a Kinect v2, capturing skeleton, depth, and color data for three different subjects. The goal is to build an interactive animation with seamless transitions between recorded motions. Segmentation restricts the depth image to the person’s region using skeleton cues and is refined by fitting the floor plane and removing nearby points. Feasible transition frames between motions are selected by minimizing the L2 distance based on similarity measures, and transitions are smoothed by synthesizing intermediate frames that move pixels according to optical flow. An interactive system lets users choose a character and control sequences of motions. A user study assessed realism and showed higher preference and perceived realism for the proposed method compared with no animation and simple alpha blending. The findings also suggest that the number of intermediate frames should be chosen adaptively based on the similarity score and the speeds before and after the transition.
Dette speciale undersøger en lavpris-tilgang til videoanimation af mennesker ved hjælp af en Kinect v2, der indsamler skelet-, dybde- og farvedata for tre forskellige personer. Formålet er at konstruere en interaktiv animation med sømløse overgange mellem optagne bevægelser. Segmenteringen af billedmaterialet begrænses først til personens område i dybdebilledet via skeletinformation og forbedres ved at modellere gulvets plan og fjerne nærliggende punkter. Mulige overgangstidspunkter mellem bevægelser identificeres ved at minimere L2-afstanden mellem kandidatrammer baseret på lighedsmål, og overgange udglattes ved at generere mellemrammer, hvor pixelpositioner flyttes efter den optiske strøm. En interaktiv løsning giver brugeren mulighed for at vælge karakter og styre sekvenser af bevægelser. Realismen af de foreslåede overgange blev vurderet i et brugerstudie, som viste højere præference og oplevet realisme end både ingen animation og simpel alpha-blending. Resultaterne indikerer dog, at antallet af mellemrammer bør vælges adaptivt i forhold til lighedsmål og bevægelseshastighed før og efter overgangen.
[This apstract has been generated with the help of AI directly from the project full text]
