Minería de Datos
Objetivo
Conocer de manera general las técnicas y enfoques del proceso genearl de Minería de Datos. Se conocen los fundamentos y conceptos necesarios de cada una de las etapas del proceso. Se explora el uso de fuentes de datos para análisis y toma de decisiones resultantes de tareas de clasificación, predicción o agrupamiento.
Contenido
-
Introducción a minería de datos
-
Objetivos de la minería de datos
-
Problemas aptos para minería de datos
-
Aplicaciones comerciales
-
Aplicaciones no-comerciales
-
Técnicas generales para análisis de los datos (predicción, clasificación, clustering).
-
Selección de Fuentes de Datos y Calidad de Datos
-
Datos esperados para minería de datos
-
Calidad de los datos
-
Fuentes posibles de datos.
-
Preprocesamiento y Preparación de Datos
-
Operaciones sobre los datos
-
Problemas en el manejo de datos reales
-
Selección de variables
-
Muestreo, selección de registros
-
Análisis de correlación
-
Creación de nuevas variables, agregación de variables
-
Técnicas de Análisis
-
Principales técnicas para el análisis de datos.
-
Aplicación de las técnicas de análisis de datos
-
Técnicas para la identificación de características, tendencias y relaciones en los datos
-
Visualización
-
Técnicas estadísticas (correlación, análisis factorial)
-
Creación de modelos de datos: clasificación y predicción
-
Principales técnicas para clasificación y predicción de datos
-
Aplicación de las técnicas de clasificación y predicción de datos
-
Inducción de reglas: C4.5.
-
Redes neuronales.
-
Técnicas estadísticas: regresión.
-
Creación de modelos de datos: clustering
-
Conceptos fundamentales de clustering
-
Principales técnicas para el clustering
-
Aplicación de técnicas de clustering
-
Redes neuronales: Kohonen SOM
-
Técnicas estadísticas: K-means
-
Clustering difuso: Fuzzy c-Means
-
Evaluación de modelos
-
Conceptos fundamentales
-
Técnicas de evaluación de modelos
-
Aplicación de las técnicas de evaluación de modelos
Bibliografía
-
Data Mining: Concepts and Techniques, 2nd ed. Jiawei Han and Micheline Kamber Morgan Kaufmann, 2006
-
Data Mining: Practical Machine Learning Tools and Techniques I.H. Witten and E. Frank Morgan Kaufmann, 1999
-
Machine Learning Tom M. Mitchell Prentice Hall, 2003
-
Inteligencia Artificial Russell y Norvig Prentice Hall, 2009
-
Pang-Ning Tan, Michael Steinbach and Vipin Kumar. Introduction to Data Mining. Addison- Wesley. 2006. ISBN: 0321321367.
-
Anil K. Jain, Richard C. Dubes. Algorithms for Clustering Data. Prentice Hall. 1988. ISBN: 013022278X.
-
T. Hastie, R. Tibshirani and J. Friedman. Elements of Statistical Learning: Data Mining, Inference and Prediction. Springer-Verlag. 2001. ISBN: 0387952845.