Visión estéreo

Visión estéreo

La visión estéreo es la capacidad de deducir la estructura tridimensional de una escena a partir de dos o más imágenes tomadas desde distintos puntos de vista.

Las personas utilizan la visión estéreo: perciben profundidad porque tienen dos ojos. A pesar de que el cerebro asigna distancias gracias al aprendizaje, lo cierto es que a una persona con un ojo tapado le costará mucho más coger un objeto, o tocar un determinado punto. Esto es así porque al cerrar un ojo se pierde la percepción de la profundidad, y sólo queda la acción del cerebro.

Los sistemas artificiales de visión estéreo suelen denominarse biológicamente inspirados, debido precisamente a que la visión estéreo es el sistema natural que utilizan muchos seres vivos para percibir su entorno. Sin embargo, este término no debe llevar a error, pues la variedad de sistemas de percepción estéreo artificiales es grande, y muchos no recuerdan en absoluto a los ojos de los seres vivos.

La base de la visión estéreo es que, cuando dos cámaras captan una escena desde posiciones distintas, hay un número de relaciones geométricas entre los puntos 3D de la escena y las proyecciones de éstos en las imágenes 2D captadas por ambas cámaras. Como se ve en la figura inferior, el punto P proyecta en el píxel pI de la imagen izquierda, y en el píxel pD de la imagen derecha.

La disparidad es el desplazamiento resultante de un punto proyectado en una imagen respecto a la otra. En el ejemplo de la figura, la disparidad de P se calcularía como se indica en la siguiente fórmula:

.

El problema de la reconstrucción consiste en determinar la estructura tridimensional a partir de las disparidades de todos los puntos percibidos. La reconstrucción se realiza mediante triangulación, como sigue:

En el gráfico superior, B es la distancia entre cámaras o baseline, xI y xD son las proyecciones del punto sobre las imágenes izquierda y derecha, respectivamente, y f es la distancia focal. Se puede comprobar que en este caso los planos de proyección (las imágenes) izquierda y derecha están en paralelo. Dicho de otro modo, los ejes de las cámaras izquierda y derecha son paralelos. Esta situación es muy común en visión estéreo, pues simplifica mucho los cálculos de profundidad.

 

Obra publicada con Licencia Creative Commons Reconocimiento 3.0