Maestría en Ciencia de Datos
Segundo Bloque: Otoño

Métodos Avanzados de Ciencia de Datos

Temario: 

1. Análisis de conjuntos frecuentes
Algoritmo a-priori
Market basket analysis

2. Búsqueda de elementos similares 1
Minhashing para documentos

3. Búsqueda de elementos similares 2
Locality Sensitive Hashing (LSH)

4. Aplicaciones de LSH
Joins de similitud aproximados

5. Procesamiento de flujos de datos
Selección de muestras y hashing
Filtro de Bloom

6. Conteo probabilístico
Algoritmo de Flajolet-Martin
Hyperloglog

7. Sistemas de recomendación 1
Recomendación por contenido y filtros colaborativos
Factorización de matrices y Dimensiones latentes

8. Sistemas de recomendación 2
Métodos basados en similitud
Mínimos cuadrados alternados

9. Sistemas de recomendación 3
Descenso en gradiente estocástico
Sistemas para retroalimentación implícita

10. Análisis de redes 1
Medidas de centralidad

11. Análisis de redes 2
Pagerank

12. Modelos de lenguaje 1
N-gramas y conteos
Métodos de suavizamiento
Aplicaciones

13. Modelos de lenguaje 2
Representación de palabras (embeddings)
Modelos de redes neuronales
Word2vec

14. Aplicaciones de modelos de lenguaje
Corrección de ortografía
Reconocimiento de idioma
Clasificación de textos

15. Recuperación de información
Índices invertidos
Modelo de espacio vectorial
Normalización y similitud
Indexado semántico latente

16. Experimentación y algoritmos de tragamonedas
Experimentación y contrafactuales
Algoritmos de tragamonedas
Tragamonedas bayesianos



El programa de la Maestría en Ciencia de Datos es una iniciativa del ITAM para satisfacer la creciente demanda nacional e internacional de profesionistas con conocimientos sólidos en el modelado a partir de datos (en especial grandes datos) para ayudar a la toma de decisiones estratégicas.