- Introducción a Data Science
- ¿Qué es Data Science?
- Probabilidad básica, esperanza, varianza y correlación.
- Ecuación de Demoivre, correlación y causalidad.
- ¿Qué es Big Data?
- Introducción a la visualización de datos
- Análisis exploratorio
- Introducción a Pandas
- Operaciones simples sobre Dataframes y Series
- Visualización de datos con Matplotlib y Seaborn
- Pandas avanzado: Paradigma split-apply-combine, groupby, transform, append, concat, merge
- Pandas muy avanzado: manejo de memoria, stack, unstack, pivot & pivot table
- NLP I
- Bag of Words (BOW)
- TF-IDF
- Stemming, Lemmatizing y Stopwords
- Compresión e IA:
- Teoría de la información
- Compresión sin pérdida
- Complejidad de Kolmogorov
- Inducción de Solomonoff
- Clase especial de análisis de datos
- ETLs: airflow y armado de dashboards
- Plotly
- Tableau
- Spark
- Teoría de map-reduce
- API de RDDs
- Transformaciones y acciones
- Joins y broadcast joins
- Estructuras de alto nivel
- Clase especial de spark: Pipelines avanzados de Spark con Airflow en Google Cloud
- Machine Learning:
- Teoría de Machine Learning (bias-variance, overfitting, underfitting, hiperparámetros y parámetros)
- Clasificación y Regresión
- Métricas y Errores
- Linear y logistic regression
- KNN
- Árboles, Random Forest y XGBoost
- Feature Engineering
- Deep Learning:
- Perceptrón
- Teorema de aproximación universal y activaciones no lineales
- Descenso por el gradiente y backpropagation
- Aprendizaje profundo y sus aplicaciones
- Algunas arquitecturas importantes
- NLP II:
- Recurrent Neural Networks
- Convoluciones 1D, Max pooling y Average pooling
- Word embeddings
- Fasttext
- Char embeddings
- Reducción de dimensiones:
- PCA/SVD
- LSI
- MDS y Laplacian Eigenmaps
- t-SNE y uMAP
- Clustering
- Clustering jerárquico
- K-Means y K-Means online
- Clustering espectral
- DBScan y HDBScan
- Fairness
- Ética, sesgo, discriminación, proxies y otras definciones
- Sesgo estadístico
- Calibración
- El caso de COMPAS
- Fairness
- Group Fairness
- Teoremas de imposibilidad de Fairness
- Discriminación positiva: impacto en métricas
- Fairness Tree
- Redes neuronales adversariales para mitigar proxies
- Individual Fairness