Resumen El reconocimiento de objetos hechos por el ser humano es una tarea que ha tomado gran importancia en los últimos años, gracias a las investigaciones en navegación automática, tanto en interiores como en exteriores, ya que estas requieren que vehículos y robots posean la capacidad de identificar e interactuar con el entorno urbano y casero, teniendo como prioridad el uso de algoritmos rápidos y robustos, y reconociendo una gran cantidad de objetos cotidianos, de forma casi instantánea. Los investigadores, que actualmente se encuentran trabajando en esta área, han dejado atrás los ejercicios académicos en los que era suficiente discernir entre una decena de objetos muy distinguibles, centrándose en el problema real de la navegación autónoma, que involucra clasificar cientos de objetos hechos por el ser humano. Esto implica extraer nuevas características de las imágenes que robots y vehículos usan para orientarse, permitiendo alcanzar nuevos hitos y mejores porcentajes en la clasificación. El presente trabajo utiliza sensores de profundidad junto con imágenes tradicionales (imágenes RGBD), aumentando la información del sistema. Este enfoque es usado por varios autores en la literatura, quienes lo combinan con técnicas tradicionales, como descriptores de imágenes, para buscar ligeras mejoras en la asertividad. Nuestro enfoque sigue un camino distinto en aras de mejorar la asertividad del proceso de clasificación, aprovechando las características del diseño industrial de los objetos hechos por el ser humano, estructurados a partir de primitivas tridimensionales. Usando la información de la capa de profundidad, es posible utilizar técnicas basadas en sketching para ajustar primitivas tridimensionales al objeto, de manera automática, y apegarse a los principios del diseño industrial, mediante restricciones geosemánticas, durante el proceso de ajuste, obteniendo así una reconstrucción certera de su estructura. De esta manera, en lugar de utilizar características de la imagen para el proceso de clasificación, se pueden usar las características de las primitivas tridimensionales que componen un objeto, mejorando la asertividad en la clasificación con una técnica que, además, resulta invariante ante transformaciones geométricas y factores, como sombras, luces y ruido en la imagen. Palabras clave: objetos hechos por el ser humano, clasificación, sketching, restricciones geosemánticas, primitivas tridimensionales, ajuste de primitivas
Abstract Recognizing human made objects is one of the most important tasks in the last years because of its relevance in all the autonomous navigation research projects. Both indoor and outdoor navigations are required by robots and vehicles with the capacity to identify and interact with urban and in-house environments, using fast and strong algorithms as priority, and recognizing in real time a big amount of the daily life objects. Researchers that are currently working on this area have left behind the academic exercises where it was enough for them to pick out between just ten objects that were extremely different from each other. Now they are concentrating on the real problem of autonomous navigation, that involves the classification of hundreds of human made objects. This implies to get new characteristics from the images, that robots and vehicles use to navigate, allowing us to achieve new goals and better classification ranks. This research work uses depth sensors along with traditional images (RGBD images), increasing the system's information. This mindset has been used before by a lot of other researchers in this topic, who use it along with traditional techniques, such as image descriptors, to achieve little improvement on the assertiveness. Our approach follows a dierent way, searching to improve the assertivity in the classification process, and taking advantage of the industrial design of human made objects, structured by tridimensional primitives. Using the information provided by the depth layer, we can use a sketching-based technique to fit tridimensional primitives to the object, in an autonomous way and sticking to the bases of the industrial design by geosemantic constrains in the process, getting an approach to the object's structure. In this way, instead of using the characteristics of an image to classify it, we use the characteristics of the tridimensional primitives that form the object, improving the assertivity on the classification with a technique that is also invariant to geometric transformations, shadows, lights, and noise in the image. Keywords: man-made objects, classification, sketching, geosemantic constraints, threedimensional primitives, primitives fitting
|
||||