Temario

Introducción a Data Science

¿Qué es Data Science?
Probabilidad básica, esperanza, varianza y correlación.
Ecuación de Demoivre, correlación y causalidad.
¿Qué es Big Data?
Introducción a la visualización de datos

Análisis exploratorio

Introducción a Pandas
Operaciones simples sobre Dataframes y Series
Visualización de datos con Matplotlib y Seaborn
Pandas avanzado: Paradigma split-apply-combine, groupby, transform, append, concat, merge
Pandas muy avanzado: manejo de memoria, stack, unstack, pivot & pivot table

NLP I

Bag of Words (BOW)
TF-IDF
Stemming, Lemmatizing y Stopwords

Compresión e IA:

Teoría de la información
Compresión sin pérdida
Complejidad de Kolmogorov
Inducción de Solomonoff

Clase especial de análisis de datos

ETLs: airflow y armado de dashboards
Plotly
Tableau

Spark

Teoría de map-reduce
API de RDDs
Transformaciones y acciones
Joins y broadcast joins
Estructuras de alto nivel

Clase especial de spark: Pipelines avanzados de Spark con Airflow en Google Cloud
Machine Learning:

Teoría de Machine Learning (bias-variance, overfitting, underfitting, hiperparámetros y parámetros)
Clasificación y Regresión
Métricas y Errores
Linear y logistic regression
KNN
Árboles, Random Forest y XGBoost
Feature Engineering

Deep Learning:

Perceptrón
Teorema de aproximación universal y activaciones no lineales
Descenso por el gradiente y backpropagation
Aprendizaje profundo y sus aplicaciones
Algunas arquitecturas importantes

NLP II:

Recurrent Neural Networks
Convoluciones 1D, Max pooling y Average pooling
Word embeddings
Fasttext
Char embeddings

Reducción de dimensiones:

PCA/SVD
LSI
MDS y Laplacian Eigenmaps
t-SNE y uMAP

Clustering

Clustering jerárquico
K-Means y K-Means online
Clustering espectral
DBScan y HDBScan

Fairness

Ética, sesgo, discriminación, proxies y otras definciones
Sesgo estadístico
Calibración
El caso de COMPAS
Fairness
Group Fairness
Teoremas de imposibilidad de Fairness
Discriminación positiva: impacto en métricas
Fairness Tree
Redes neuronales adversariales para mitigar proxies
Individual Fairness