Minería de datos

Minería de Datos

Objetivo

Conocer de manera general las técnicas y enfoques del proceso genearl de Minería de Datos. Se conocen los fundamentos y conceptos necesarios de cada una de las etapas del proceso. Se explora el uso de fuentes de datos para análisis y toma de decisiones resultantes de tareas de clasificación, predicción o agrupamiento.

 

Contenido

  1. Introducción a minería de datos

    1. Objetivos de la minería de datos

    2. Problemas aptos para minería de datos

    3. Aplicaciones comerciales

    4. Aplicaciones no-comerciales

    5. Técnicas generales para análisis de los datos (predicción, clasificación, clustering).

 

  1. Selección de Fuentes de Datos y Calidad de Datos

    1. Datos esperados para minería de datos

    2. Calidad de los datos

    3. Fuentes posibles de datos.

 

  1. Preprocesamiento y Preparación de Datos

    1. Operaciones sobre los datos

    2. Problemas en el manejo de datos reales

    3. Selección de variables

    4. Muestreo, selección de registros

    5. Análisis de correlación

    6. Creación de nuevas variables, agregación de variables

 

  1. Técnicas de Análisis

    1. Principales técnicas para el análisis de datos.

    2. Aplicación de las técnicas de análisis de datos

    3. Técnicas para la identificación de características, tendencias y relaciones en los datos

    4. Visualización

    5. Técnicas estadísticas (correlación, análisis factorial)

 

  1. Creación de modelos de datos: clasificación y predicción

    1. Principales técnicas para clasificación y predicción de datos

    2. Aplicación de las técnicas de clasificación y predicción de datos

    3. Inducción de reglas: C4.5.

    4. Redes neuronales.

    5. Técnicas estadísticas: regresión.

 

  1. Creación de modelos de datos: clustering

    1. Conceptos fundamentales de clustering

    2. Principales técnicas para el clustering

    3. Aplicación de técnicas de clustering

    4. Redes neuronales: Kohonen SOM

    5. Técnicas estadísticas: K-means

    6. Clustering difuso: Fuzzy c-Means

 

  1. Evaluación de modelos

    1. Conceptos fundamentales

    2. Técnicas de evaluación de modelos

    3. Aplicación de las técnicas de evaluación de modelos

 

 

Bibliografía

  1. Data Mining: Concepts and Techniques, 2nd ed. Jiawei Han and Micheline Kamber Morgan Kaufmann, 2006

  2. Data Mining: Practical Machine Learning Tools and Techniques I.H. Witten and E. Frank Morgan Kaufmann, 1999

  3. Machine Learning Tom M. Mitchell Prentice Hall, 2003

  4. Inteligencia Artificial Russell y Norvig Prentice Hall, 2009

  5. Pang-Ning Tan, Michael Steinbach and Vipin Kumar. Introduction to Data Mining. Addison- Wesley. 2006. ISBN: 0321321367.

  6. Anil K. Jain, Richard C. Dubes. Algorithms for Clustering Data. Prentice Hall. 1988. ISBN: 013022278X.

  7. T. Hastie, R. Tibshirani and J. Friedman. Elements of Statistical Learning: Data Mining, Inference and Prediction. Springer-Verlag. 2001. ISBN: 0387952845.