Nuestro ámbito de investigación se centra en el procesado de voz, audio, imagen y vídeo, específicamente en extracción automática de contenido, reconocimiento de habla y locutor así como codificación de vídeo de última generación. Hemos aplicado estos métodos en varios proyectos de investigación como intefaces vocales, transcripción de voz para subtitulado, anotación automática de imagen y vídeo o codificación de vídeo de alta definición (HDTV).
Nuestras principales líneas de investigación comprenden:
- Clasificación, análisis e indexación de imágenes/vídeo
- Reconocimiento y seguimiento de objetos en imágenes/vídeo
- Tecnologías del habla
- Aplicaciones multimedia del aprendizaje máquina
- Codificación de vídeo