Maestría en Ciencia de Datos
Primer Bloque: Otoño

Introducción
a la Ciencia de Datos

Minería y Análisis de Datos

Objetivos:

El objetivo es conocer las etapas que forman parte de un proyecto de Ciencia de Datos; poder definir correctamente un proyecto de Ciencia de Datos; conocer las implicaciones en la toma de decisiones de cada etapa de un proyecto de Ciencia de Datos; conocer las métricas de desempeño off-line/on-line de un modelo predictivo así como las implicaciones de la selección correcta y cuantificar el sesgo e inequidad de los modelos construidos.

Temario

  1. Introducción a Ciencia de Datos: Estadística clásica, Optimización, Ciencia de Datos
  2. Fases de un proyecto de CD: Definición de objetivos
  3. Fases de un proyecto de CD: Scoping
  4. Fases de un proyecto de CD: Scoping Labelling
  5. Fases de un proyecto de CD: EDA
  6. Fases de un proyecto de CD: Análisis – Transformación de variables
  7. Fases de un proyecto de CD: Análisis – Pipelines, Data leakage, estimadores, transformadores
  8. Fases de un proyecto de CD: Feature Engineering
  9. Fases de un proyecto de CD: Evaluación de modelos off-line
  10. Fases de un proyecto de CD: Selección de modelos: Grid Search, Magic Loop
  11. Fases de un proyecto de CD: Selección de modelos, evaluación on-line
  12. Interpretabilidad de modelos
  13. Cuantificación de bias y fairness en los modelos



El programa de la Maestría en Ciencia de Datos es una iniciativa del ITAM para satisfacer la creciente demanda nacional e internacional de profesionistas con conocimientos sólidos en el modelado a partir de datos (en especial grandes datos) para ayudar a la toma de decisiones estratégicas.