Reconstrucción Tridimensional de Objetos mediante Técnicas Evolutivas

Reconstrucción Tridimensional de Objetos mediante Técnicas Evolutivas

Israel Vite Silva
 

Texto completo de la Tesis     

 


Resumen

Uno de los problemas clásicos del área de Visión por Computadora es la reconstrucción tridimensional métrica a partir de imágenes adquiridas por una cámara sin calibración previa. Este problema involucra, específicamente, los siguientes pasos:(1) la triangulación, (2) la calibración de la cámara y (3) la estimación de los parámetros de orientación y posición de la cámara. El paso (1), la triangulación, tiene por objetivo encontrar la posición de un punto en el espacio a partir de la intersección de dos líneas que parten de la correspondencia de puntos en dos imágenes. Con la presencia de ruido, es muy probable que esta intersección no ocurra. En tal caso es necesario encontrar la mejor aproximación. Este problema es crítico en las reconstrucciones afín y proyectiva, donde no hay definida una métrica. En esta tesis se planteó la triangulación como un problema de optimización multi-objetivo, el cual se resolvió mediante un algoritmo evolutivo llamado NSGA-II. La transformación a un problema multi-objetivo permitió obtener mejores resultados en comparación con los mejores métodos reportados.
Los pasos (2) y (3) consisten en encontrar los parámetros de la cámara (parámetros de calibración, orientación y posición) a partir de un conjunto de correspondencias de puntos extraídas de dos o más imágenes. Sin embargo, existen superficies y configuraciones de la cámara conocidas como críticas donde se ha demostrado que es imposible extraer los parámetros de la cámara al usar, solamente, correspondencias de puntos. En esta tesis se proponen tres soluciones que plantean a la calibración de la cámara, a la estimación de los parámetros de orientación y posición, y al cálculo de los puntos tridimensionales (triangulación), como un problema de optimización, con base en el modelo de la cámara oscura, y emplean un algoritmo evolutivo llamado evolución diferencial para su resolución. Al emplear, directamente, el modelo de la cámara oscura es posible encontrar los parámetros de la cámara y obtener la reconstrucción tridimensional, aún en la configuración crítica de translación pura y en superficies críticas (puntos que yacen sobre un mismo plano).
Otro problema importante dentro del área de Visión por Computadora, consiste en obtener la elipse que mejor se ajuste a un conjunto de puntos dado. Los algoritmos que resuelven este problema sólo minimizan el cuadrado de la distancia euclidiana entre la cónica y los puntos mediante métodos de gradiente, aunque no siempre convergen a la solución óptima. En esta tesis se planteó el ajuste de puntos a una elipse como un problema de optimización, el cual fue resuelto mediante un algoritmo genético y la evolución diferencial. Esta solución tiene la flexibilidad de minimizar la distancia euclidiana o su cuadrado. Al emplear la distancia euclidiana se les da mayor peso a los puntos más cercanos, a diferencia de su cuadrado, en el cual se da mayor peso a los puntos más lejanos como se observa en los resultados.

Abstract

A classic problem for Computer Vision is the three-dimensional metric reconstruction from two uncalibrated views. This problem entails the following steps: (1) triangulation, (2) camera calibration and (3) estimation of orientation and position parameters of each view. Step (1), triangulation, consists of finding the position of a point in real space as the intersection of two rays given by their corresponding images. When noise is present, the intersection of two rays may not be detected, in which case it is necessary to find the best approximation to the meet point. This problem is critical in affine and projective reconstruction, since no metric is present. In this thesis, we have proposed a solution that transforms the triangulation problem into multi-objective optimization problem, which was solved using an evolutionary algorithm called NSGA-II. The treatment as a multi-objective problem has been able to obtain better results compared with the best reported methods.
Steps (2) and (3) consist on estimating the camera parameters (calibration, orientation and position parameters) using a set of corresponding points extracted from two or more images. However, there are critical surfaces and critical camera configurations where it is not possible to recover these parameters using just the set of corresponding points. In this thesis we have proposed three solutions dealing with the camera calibration, the estimation of the orientation and position parameters of each view, and the calculation of the three-dimensional points (triangulation), all of them were merged into a general optimization problem based on the pinhole camera model and solved with an evolutionary algorithm, called differential evolution. This makes possible to estimate the camera parameters and obtaining thus the three-dimensional isometric reconstruction, even on critical camera configuration (pure translation) and critical surfaces (points lie on the same plane).
We also applied successfully evolutionary algorithms within another Computer Vision problem: ellipse fitting. The problem consists of finding the best ellipse fitting a set of given points. The current algorithms minimize the square of Euclidean distance between the conic and the set of given points through gradient methods. However, such methods do not always converge to the optimal solution. In this thesis our approach based on genetic algorithm and differential evolution were successful, minimizing the Euclidean distance or its square. With the Euclidean distance, the nearest points get greater weight, instead the squared Euclidean distance gives greater weights to distant points.