Texto completo de la plática
Resumen Los robots han ido evolucionando en los últimos años, realizan tareas cada vez más complejas, pero también se han vuelto más difícil de modelar. Una forma para conseguir que los robots realicen tareas, es utilizar sistemas de aprendizaje, como aprendizaje por refuerzo, en donde un robot aprende a realizar una tarea al explorar su ambiente. Desafortunadamente, estas técnicas normalmente requieren tiempos muy largos de apredizaje, se utiliza una representación discretizada, y una vez que se aprende cómo realizar una tarea, no se puede utilizar para aprender otra, aunque sea muy parecida. En esta plática vamos a presentar técnicas de transferencia de conocimiento que permiten acelerar el tiempo de convergencia de algoritmos de aprendizaje por refuerzo y que se pueden aplicar en dominios continuos.
Breve semblanza biográfica
El Dr. Eduardo Morales Manzanares es egresado de la carrera de Ingeniería Física de la UAM-Azcapotzalco. Tiene una maestría en Inteligencia Artificial de la Universidad de Edimburgo y un doctorado en Computación del Turing Institute - Universidad de Strathclyde, en Escocia. Sus líneas de investigación se centran en el aprendizaje computacional y en la robótica. Fue investigador visitante del Electric Power Research Institute, en Palo Alto, California, trabajó en el Instituto de Investigaciones Eléctricas, en Cuernavaca, Morelos. Fue consultor técnico del proyecto europeo "The Machine Learning Toolkit", fue profesor visitante de la Universidad de New South Wales, en Sidney, Australia, y profesor-investigador del Tec de Monterrey - Campus Cuernavaca. Actualmente (desde 2006) es investigador Titular C del Instituto Nacional de Astrofísica, Óptica y Electrónica en Puebla, en donde también tiene el puesto de Coordinador de Ciencias Computacionales. Cuenta con más de 100 publicaciones en revistas, capítulos de libros y congresos de prestigio internacional, es miembro del Sistema Nacional de Investigadores Nivel 3 y miembro de la Academia Mexicana de Ciencias. |
||||