Multimodal Features

Also known as: multimodal data, multimodal fusion

Information extracted from multiple sensory channels or data types—such as combining visual (RGB), depth, audio, and skeletal data—to improve recognition accuracy. In accessibility systems, multimodal approaches often outperform single-modality methods because different data sources provide complementary information. For sign language recognition, combining hand shape appearance with body skeleton positions captures both fine-grained hand gestures and broader arm movements.

Category: machine learning · computer vision · sign language recognition · human-computer interaction

Related: Sign Language Recognition · Gesture Recognition · Microsoft Kinect · Skeleton Tracking

Sources

https://doi.org/10.1145/2897735