PBO: Métodos Avanzados de Ciencia de Datos
Primer Bloque: Otoño
Métodos Avanzados de Ciencia de Datos
Temario:
Temario:
1. Análisis de conjuntos frecuentes
Algoritmo a-priori
Market basket analysis
2. Búsqueda de elementos similares 1
Minhashing para documentos
3. Búsqueda de elementos similares 2
Locality Sensitive Hashing (LSH)
4. Aplicaciones de LSH
Joins de similitud aproximados
5. Procesamiento de flujos de datos
Selección de muestras y hashing
Filtro de Bloom
6. Conteo probabilístico
Algoritmo de Flajolet-Martin
Hyperloglog
7. Sistemas de recomendación 1
Recomendación por contenido y filtros colaborativos
Factorización de matrices y Dimensiones latentes
8. Sistemas de recomendación 2
Métodos basados en similitud
Mínimos cuadrados alternados
9. Sistemas de recomendación 3
Descenso en gradiente estocástico
Sistemas para retroalimentación implícita
10. Análisis de redes 1
Medidas de centralidad
11. Análisis de redes 2
Pagerank
12. Modelos de lenguaje 1
N-gramas y conteos
Métodos de suavizamiento
Aplicaciones
13. Modelos de lenguaje 2
Representación de palabras (embeddings)
Modelos de redes neuronales
Word2vec
14. Aplicaciones de modelos de lenguaje
Corrección de ortografía
Reconocimiento de idioma
Clasificación de textos
15. Recuperación de información
Índices invertidos
Modelo de espacio vectorial
Normalización y similitud
Indexado semántico latente
16. Experimentación y algoritmos de tragamonedas
Experimentación y contrafactuales
Algoritmos de tragamonedas
Tragamonedas bayesianos