Skip to content

Latest commit

 

History

History
76 lines (75 loc) · 2.4 KB

File metadata and controls

76 lines (75 loc) · 2.4 KB

Temario

  1. Introducción a Data Science
  • ¿Qué es Data Science?
  • Probabilidad básica, esperanza, varianza y correlación.
  • Ecuación de Demoivre, correlación y causalidad.
  • ¿Qué es Big Data?
  • Introducción a la visualización de datos
  1. Análisis exploratorio
  • Introducción a Pandas
  • Operaciones simples sobre Dataframes y Series
  • Visualización de datos con Matplotlib y Seaborn
  • Pandas avanzado: Paradigma split-apply-combine, groupby, transform, append, concat, merge
  • Pandas muy avanzado: manejo de memoria, stack, unstack, pivot & pivot table
  1. NLP I
  • Bag of Words (BOW)
  • TF-IDF
  • Stemming, Lemmatizing y Stopwords
  1. Compresión e IA:
  • Teoría de la información
  • Compresión sin pérdida
  • Complejidad de Kolmogorov
  • Inducción de Solomonoff
  1. Clase especial de análisis de datos
  • ETLs: airflow y armado de dashboards
  • Plotly
  • Tableau
  1. Spark
  • Teoría de map-reduce
  • API de RDDs
  • Transformaciones y acciones
  • Joins y broadcast joins
  • Estructuras de alto nivel
  1. Clase especial de spark: Pipelines avanzados de Spark con Airflow en Google Cloud
  2. Machine Learning:
  • Teoría de Machine Learning (bias-variance, overfitting, underfitting, hiperparámetros y parámetros)
  • Clasificación y Regresión
  • Métricas y Errores
  • Linear y logistic regression
  • KNN
  • Árboles, Random Forest y XGBoost
  • Feature Engineering
  1. Deep Learning:
  • Perceptrón
  • Teorema de aproximación universal y activaciones no lineales
  • Descenso por el gradiente y backpropagation
  • Aprendizaje profundo y sus aplicaciones
  • Algunas arquitecturas importantes
  1. NLP II:
  • Recurrent Neural Networks
  • Convoluciones 1D, Max pooling y Average pooling
  • Word embeddings
  • Fasttext
  • Char embeddings
  1. Reducción de dimensiones:
  • PCA/SVD
  • LSI
  • MDS y Laplacian Eigenmaps
  • t-SNE y uMAP
  1. Clustering
  • Clustering jerárquico
  • K-Means y K-Means online
  • Clustering espectral
  • DBScan y HDBScan
  1. Fairness
  • Ética, sesgo, discriminación, proxies y otras definciones
  • Sesgo estadístico
  • Calibración
  • El caso de COMPAS
  • Fairness
  • Group Fairness
  • Teoremas de imposibilidad de Fairness
  • Discriminación positiva: impacto en métricas
  • Fairness Tree
  • Redes neuronales adversariales para mitigar proxies
  • Individual Fairness