Mapas de profundidad

Mapas de profundidad

Un mapa de profundidad es una matriz que contiene valores de distancias.

En todos los aspectos, un mapa de profundidad es equivalente a una imagen, sólo que en vez de almacenar valores de color, almacena distancias.

Para representar un mapa de profundidad, lo normal es dibujar todos los puntos de la matriz formando una imagen. El color de cada píxel en esta imagen depende del valor de distancia almacenado. Por ejemplo, en la siguiente figura se representa un mapa de profundidad obtenido con el sensor Kinect:

Cada punto almacena una distancia, y se representa más claro conforme esa distancia es menor. Esta representación permite hacerse una idea rápida de la información almacenada en el mapa de profundidad. Por ejemplo, en la imagen se ve no sólo que hay una persona delante de la Kinect, sino que además se percibe cómo esa persona está alzando su mano izquierda, y acercándola al sensor (por eso se ve más clara).

Dado que almacenan distancias, si se conocen los parámetros del dispositivo con el que se ha obtenido el mapa de profundidad (ángulo de visión, tipo de lente, etc.), es posible construir a partir de dicho mapa una representación tridimensional de la escena como las siguientes:

Reflexión

¿Crees que las representaciones anteriores son, realmente, una reconstrucción 3D del entorno? O... ¿les falta algo?

Atención

Los mapas de profundidad almacenan distancias. Sin embargo, es normal usar otro tipo de representación, muy parecida: los mapas de disparidad.

La Kinect, concretamente, suministra mapas de disparidad, no de profundidad. Es importante recordar que ambos tipos de mapa contienen exactamente la misma información.

De la disparidad, y de los mapas de disparidad, se habla más adelante en detalle, en el apartado de Visión estéreo (pues la disparidad es un concepto relacionado con la visión estereoscópica).

Obra publicada con Licencia Creative Commons Reconocimiento 3.0