PBO: Minería y Análisis de Datos
Maestría en Ciencia de Datos
Primer Bloque: OtoñoMinería y Análisis de Datos
Primer Bloque: Otoño
Introducción a la Ciencia de Datos
Objetivos:
El objetivo es conocer las etapas que forman parte de un proyecto de Ciencia de Datos; poder definir correctamente un proyecto de Ciencia de Datos; conocer las implicaciones en la toma de decisiones de cada etapa de un proyecto de Ciencia de Datos; conocer las métricas de desempeño off-line/on-line de un modelo predictivo así como las implicaciones de la selección correcta y cuantificar el sesgo e inequidad de los modelos construidos..
El objetivo es conocer las etapas que forman parte de un proyecto de Ciencia de Datos; poder definir correctamente un proyecto de Ciencia de Datos; conocer las implicaciones en la toma de decisiones de cada etapa de un proyecto de Ciencia de Datos; conocer las métricas de desempeño off-line/on-line de un modelo predictivo así como las implicaciones de la selección correcta y cuantificar el sesgo e inequidad de los modelos construidos..
Temario:
- Introducción a Ciencia de Datos: Estadística clásica, Optimización, Ciencia de Datos
- Fases de un proyecto de CD: Definición de objetivos
- Fases de un proyecto de CD: Scoping
- Fases de un proyecto de CD: Scoping Labelling
- Fases de un proyecto de CD: EDA
- Fases de un proyecto de CD: Análisis – Transformación de variables
- Fases de un proyecto de CD: Análisis – Pipelines, Data leakage, estimadores, transformadores
- Fases de un proyecto de CD: Feature Engineering
- Fases de un proyecto de CD: Evaluación de modelos off-line
- Fases de un proyecto de CD: Selección de modelos: Grid Search, Magic Loop
- Fases de un proyecto de CD: Selección de modelos, evaluación on-line
- Interpretabilidad de modelos
- Cuantificación de bias y fairness en los modelos