Ce dépôt contient le code de la 1ère édition du Bootcamp Analyse de Données avec Python enseigné par Kevin Degila .
Ce bootcamp vous apprend les bases du langage de programmation Python🐍 et l'Analyse de données 📉, de l'import à la visualisation.
Nous utilisons Google Colab dans ce bootcamp. Accédez à tous les notebooks sur Colab en cliquant ici : . Certains notebooks sont encore en cours d'écriture.
Les vidéos de ce bootcamp seront disponibles gratuitement sur la chaîne YouTube Kevin Degila : https://www.youtube.com/c/KevinDegila
- Importer des données sous format csv, sql json, html et autres pour de l'analyse
- Nettoyer, transformer et explorer les données avec Pandas et Numpy
- Utiliser des notions statistiques pour répondre à des questions utiles à propos de vos données
- Appliquer les principes de la Visualisation pour découvrir des informations utiles et faire du storytelling
- Coder dans le cloud avec Google Colab : Lien Vidéo
- Installer Jupyter notebook en local : Lien Vidéo
- Les Variables et opérateurs
- Les Types de données en Python (int, float, str, list, tuples, dict, set)
- Recevoir des données de l'utilisateur avec la fonction input
- Les conditions (if else elif)
- Les boucles (for, while)
- Les fonctions et Modules
- Manipuler les fichiers en Python
- La programmation orientée objet en Python
- Les bases d'un tableau Numpy
- Les fonctions Numpy: alternative plus rapide aux boucles
- Filtrage et indexation des tableaux Numpy
- Le concept de broadcasting: diffusion de vecteur
- Les bases d'un dataframe Pandas
- Sélection, Filtrage et Indexation des données avec Pandas
- Gestion des valeurs manquantes avec Pandas
- Combiner et Merger des datasets avec Pandas
- Opérations et aggrégation de données avec Pandas
- Nettoyage et ordonnement des données avec Pandas
- Analyse des séries temporelles
- Introduction à la visualisation avec Pandas
- Guide pour la visualisation des données
- Les bases de Matplotlib
- De meilleures visualisations avec Seaborn
- Projet 1 : Analyse des données du Titanic
- Projet 2: Analyse de données de vente d'un supermarché sur une année
- Projet 3 : Analyse des données du Covid 19 dans le monde
- Chaque module est accompagné d'un ou plusieurs notebooks explicatifs
- Chaque sous-module est accompagné d'exercices pour pratiquer les notions apprises
- On fera plusieurs erreurs lors des séances live ou vidéos afin d'apprendre comment chercher des solutions à chaque erreur
- Ce bootcamp n'enseignera pas tout ce qu'il faut mais le strict nécéssaire. Les apprenants seront appélés à complèter quelques notions par eux-mêmes grâce aux différentes ressources partagées. Savoir apprendre de nouvelles notions tout seul est une qualité chez un data analyst.
L'un des avantages du format Bootcamp est d'apprendre des autres apprenants. Nous utiliserons Discord pour la communication hors séance live. Voici le lien du serveur : https://discord.gg/sHE5exZ . N'hésitez pas à poser des questions et à répondre quand vous avez les réponses aux questions posées.
- Site pour apprendre et s'exercer en Python : https://www.w3schools.com/python/
- Visualiser l'éxecution de votre code Python avec Python Tutor : http://pythontutor.com/
- Livre gratuit pour apprendre Numpy, Pandas, Matplotlib et Seaborn : https://jakevdp.github.io/PythonDataScienceHandbook/
- Site pour s'exercer en Python en s'amusant : https://www.codingame.com/start
- Kaggle Datasets : https://www.kaggle.com/datasets
- fivethirtyeight : https://data.fivethirtyeight.com/
- Google Dataset Search : https://datasetsearch.research.google.com/
- UCI Machine Learning Repository : https://archive.ics.uci.edu/ml/datasets.php
- BuzzFeed News : https://github.com/BuzzFeedNews
- Banque mondiale : https://data.worldbank.org/
Vous pouvez soutenir ce bootcamp à travers le partage à des personnes qui en profiteraient et en faisant un don à https://paypal.me/kevindegila . Les fonds recueillies permettront d'augmenter la qualité des vidéos qui accompagnent le code.
Vous pouvez m'envoyer un mail à [email protected]