Skip to content

Latest commit

 

History

History
102 lines (71 loc) · 4.96 KB

README.md

File metadata and controls

102 lines (71 loc) · 4.96 KB

Bootcamp Analyse de données avec Python 🐍 📉

Ce dépôt contient le code de la 1ère édition du Bootcamp Analyse de Données avec Python enseigné par Kevin Degila .

Ce bootcamp vous apprend les bases du langage de programmation Python🐍 et l'Analyse de données 📉, de l'import à la visualisation.

Nous utilisons Google Colab dans ce bootcamp. Accédez à tous les notebooks sur Colab en cliquant ici : Colab. Certains notebooks sont encore en cours d'écriture.

Les vidéos de ce bootcamp seront disponibles gratuitement sur la chaîne YouTube Kevin Degila : https://www.youtube.com/c/KevinDegila

A la fin de ce bootcamp, vous serez en mesure de :

  • Importer des données sous format csv, sql json, html et autres pour de l'analyse
  • Nettoyer, transformer et explorer les données avec Pandas et Numpy
  • Utiliser des notions statistiques pour répondre à des questions utiles à propos de vos données
  • Appliquer les principes de la Visualisation pour découvrir des informations utiles et faire du storytelling

📜 Plan du bootcamp

Module 0: Introduction à Jupyter notebook 📓

Module 1 : Les bases de Python 🐍

  • Les Variables et opérateurs
  • Les Types de données en Python (int, float, str, list, tuples, dict, set)
  • Recevoir des données de l'utilisateur avec la fonction input
  • Les conditions (if else elif)
  • Les boucles (for, while)
  • Les fonctions et Modules
  • Manipuler les fichiers en Python
  • La programmation orientée objet en Python

Module 2 : Introduction au calcul numérique avec Numpy 🧱

  • Les bases d'un tableau Numpy
  • Les fonctions Numpy: alternative plus rapide aux boucles
  • Filtrage et indexation des tableaux Numpy
  • Le concept de broadcasting: diffusion de vecteur

Module 3 : Manipuler les données avec Pandas ⚙️

  • Les bases d'un dataframe Pandas
  • Sélection, Filtrage et Indexation des données avec Pandas
  • Gestion des valeurs manquantes avec Pandas
  • Combiner et Merger des datasets avec Pandas
  • Opérations et aggrégation de données avec Pandas
  • Nettoyage et ordonnement des données avec Pandas
  • Analyse des séries temporelles
  • Introduction à la visualisation avec Pandas

Module 4 : Visualization des données avec Matplotlib et Seaborn 📊

  • Guide pour la visualisation des données
  • Les bases de Matplotlib
  • De meilleures visualisations avec Seaborn

Module 5 : Projet Analyse de données ⚒️

  • Projet 1 : Analyse des données du Titanic
  • Projet 2: Analyse de données de vente d'un supermarché sur une année
  • Projet 3 : Analyse des données du Covid 19 dans le monde

Format du bootcamp 🛡️

  • Chaque module est accompagné d'un ou plusieurs notebooks explicatifs
  • Chaque sous-module est accompagné d'exercices pour pratiquer les notions apprises
  • On fera plusieurs erreurs lors des séances live ou vidéos afin d'apprendre comment chercher des solutions à chaque erreur
  • Ce bootcamp n'enseignera pas tout ce qu'il faut mais le strict nécéssaire. Les apprenants seront appélés à complèter quelques notions par eux-mêmes grâce aux différentes ressources partagées. Savoir apprendre de nouvelles notions tout seul est une qualité chez un data analyst.

Apprendre en Communauté 🤝

L'un des avantages du format Bootcamp est d'apprendre des autres apprenants. Nous utiliserons Discord pour la communication hors séance live. Voici le lien du serveur : https://discord.gg/sHE5exZ . N'hésitez pas à poser des questions et à répondre quand vous avez les réponses aux questions posées.

Ressources supplémentaires 📚

Site pour télécharger des données 📖

Soutenir ce bootcamp 🙌

Vous pouvez soutenir ce bootcamp à travers le partage à des personnes qui en profiteraient et en faisant un don à https://paypal.me/kevindegila . Les fonds recueillies permettront d'augmenter la qualité des vidéos qui accompagnent le code.

Me contacter 📩

Vous pouvez m'envoyer un mail à [email protected]