Robótica móvil

Se pretende facilitar una representación en tiempo real a partir de una secuencia de vídeo. Para ello, se utilizan métodos híbridos que permiten combinar información densa (relativa a nubes de puntos 3D) y dispersa (soportada sobre elementos geométricos significativos). La detección, actualización y seguimiento de elementos geométricos proporciona modelos toscos de perspectiva, fáciles de actualizar que actúan como “atractores” para la información densa que se captura. Un método desarrollado por investigadores del MoBiVAP utiliza una trapezoidización de la imagen. Una vez inicializado el sistema, el mapa trapezoidal facilita la puesta en correspondencia, el seguimiento usando dos imágenes anteriores de la misma escena en instantes previos y la predicción usando una variante extendida iterada de Filtros Kalman sobre el espacio de trapezoides.  La validación del flujo de imágenes permite integrar diferentes aspectos que facilitan operaciones de navegación en entornos de interior.

Reconocimiento de comportamientos

Localización y seguimiento de la trayectoria realizada por diferentes individuos en una escena. Se trabaja a partir de un procesamiento de imágenes basado en un pipeline básico:

  1. Segmentación tosca basada en sustracción de fondo.
  2. Reducción inicial del ruido y corrección de defectos debidos a baja iluminación. Mejora y estabilización de la imagen.
  3. Extracción, etiquetado y clasificación de objetos móviles de acuerdo con trayectorias típicas. Evaluación usando aprendizaje.
  4. Predicción y validación de los movimientos observados, según criterios de proximidad cualitativos (distancia Hausdorff) asociados a la superposición de siluetas (superficies espacio-temporales).
  5. Seguimiento simultáneo de agentes a diferentes niveles (individual vs grupal), incluyendo movimiento relativo asociado a cámaras móviles.

Análisis de imágenes de tráfico

Procesamiento y Análisis de secuencias de Vídeo basadas en cámara fija para estimar características del tráfico (fluido, denso, saturado y detección precoz de situaciones de riesgo en intersecciones.  Corrección del ruido, estabilización y regularización de marcas ó características. Mejora artificial de la resolución temporal.

Cámara móvil embarcada para detección de riesgos, estimación de características métricas asociadas a otros agentes existentes en la calzada. Detección de señalización vertical y horizontal con baja visibilidad.

Fusión de información en tiempo real para facilitar asistencia a la conducción o a la supervisión de comportamientos por parte de diferentes agentes en escenas complejas.

Reconocimiento y clasificación de texturas

Representación simplificada de texturas en términos de “células básicas” que se deforman al tiempo que se propagan. Segmentación por teselas o textones asociados a patrones radiométricos. Medida del desorden en la distribución mediante entropía. Selección manual del número máximo de patrones permitido.

Se aplican técnicas de “Machine Learning” para identificar y clasificar patrones complejos en imágenes digitales aéreas o satelitales. Se ha utilizado para la clasificación de cultivos de diferentes tipos y para la detección de manchas de contaminación en zonas marítimas próximas a la costa.

Procesamiento de rasgos faciales

La identificación de características faciales ha recibido un fuerte impulso gracias al avance en la tecnología de video multimedia propiciándose así un aumento de cámaras en los lugares de trabajo y en el hogar con un reducido coste. El reconocimiento facial se puede aplicar a múltiples propósitos: seguridad, interacción humano-computador, reconocimiento de personas, etc.

El reconocimiento de gestos faciales utiliza una aproximación basada en hechos asociados a elementos característicos (ojos y boca sobre todo) y su seguimiento en términos de patrones asociados a Unidades de Acción (AU). La elevación a modelos 3D utiliza mapas de curvaturas para superficies asociadas a nubes de puntos capturadas previamente (mediante Visión Estéreo o Láser) y que permiten inicializar el sistema.

Procesamiento de imágenes biomédicas

El procesamiento y análisis de imágenes biomédicas tiene como objetivo proporcionar una asistencia al diagnóstico en relación con dolencias, enfermedades ó patologías. Para ello, utiliza información procedente de diferentes dispositivos. Hay muchos tipos de imágenes, entre las cuales cabe destacar radiografías, tomografías computerizadas (CT) o de emisión de positrones (PET), resonancias magnéticas (asociadas a diferentes tipos de campos), etc. Algunos de los problemas más relevantes son segmentación, alineamiento, restauración y modelado. La combinación de diferentes tipos de imágenes y estrategias de análisis permite obtener información relativa a las superficies que acotan los órganos o representaciones volumétricas de gran utilidad para la asistencia al diagnóstico.

Visión estéreo

La Visión Estéreo trata de imitar las funcionalidades de la visión binocular de los mamíferos superiores. El objetivo inicial es la recuperación de un mapa denso de profundidad en un rango de variación similar al de la visión humana. Para ello, se pueden utilizar aproximaciones basadas en hechos dispersos (elementos aislados como esquinas ó máximos de intensidad, p.e.) ó densos (manchas de color con características similares). Los dos enfoques son complementarios y se han diseñado diferentes procedimientos de realimentación entre ambos. El enfoque predominante más robusto utiliza la Geometría Epipolar que impone restricciones estructurales que deben verificar los elementos homólogos.

Para obtener resultados en tiempo real es conveniente incorporar manchas de color asociados a una envolvente visual con información radiométrica (envolvente fotométrica). Algunos de los desarrollos más relevantes conciernen a (1) la obtención de representaciones volumétricas de actores en movimiento capturados por cámaras sincronizadas en un entorno controlado y (2) la generación de actores virtuales a partir de dichas representaciones volumétricas. Estos tópicos se abordan en la asignatura complementaria de Visión Estéreo Dinámica.

Reconstrucción 3D

Los objetivos de la Reconstrucción 3D son la generación de nuevas vistas a partir de otras dadas y la visualización de objetos volumétricos que puedan ser explorados de forma interactiva. Habitualmente, utiliza dos o más cámaras. Los desarrollos más avanzados conciernen a la reconstrucción a partir de una cámara de vídeo. La Reconstrucción métrica facilita una estimación precisa de coordenadas 3D para puntos significativos de un objeto. Algunas de las aplicaciones más relevantes son:

  1. Representación volumétrica de objetos rígidos estáticos.
  2. Control de calidad industrial asociado a configuraciones 3D.
  3. Guiado de Robots móviles mediante cámaras embarcadas.
  4. Mapas tridimensionales del terreno o de objetos complejos (esculturas, p.e.)
  5. Medicina: Representación volumétrica de objetos, huesos u órganos internos; Visualización y navegación interactivas; Simulación y Asistente para operaciones complejas
  6. Modelado 3D semiautomático usando diferentes tipos de superficies
  7. Soporte a la renderización y a la creación de contenidos incorporando efectos de color e iluminación.