- Universidad: Universidad Mayor de San Andrés
- Carrera: Estadística
- Sigla: Plan 2012 EST-384. Plan 2021 EST-381
- Pre requisito: Plan 2012 Programación Estadística I. Plan 2021 Análisis de datos masivos I
- Nivel: Pregrado. Plan 2012 Optativa, Plan 2021 Semestre 8
- Planificación: Aquí
- Acerca del proyecto: Aquí
- Repositorio de la materia: Aquí
- Apuntes de la materia: Aquí
- Temas:
- Introducción a la minería de datos: KDD, fuentes de datos
- Pre procesamiento; Filtrado y selección de variables, visualización de datos, imputación
- Reducción de Dimensionalidad: PCA, CA, MCA
- Clustering: K-center, Jerárquico
- Regresión: Simple, múltiple, logística/probit
- Clasificación: logística/probit, Naive bayes, CART
- Reglas de asociación: Apriori, Eclat
- Minería de texto: Frecuencias, correlaciones, análisis de sentimiento, Redes sociales.
- Libro guía: Data Mining with R, Luis Torgo.
- Libro recomendado 1: Applied Multivariate Statistical Analysis, Johnson & Wichern
- Libro recomendado 2: Text Mining in Practice with R, Ted Kwartler.
- Libro recomendado 3: Practical Data Science with R, Nina Zumel & John Mount