Je suis fraîchement diplômé en tant que Data Scientist, j'ai de l'expérience en analyse de données, en modélisation statistique, et en machine learning. J'ai réalisé plusieurs projets dans divers domaines, allant de l'éducation à la santé publique, en passant par le commerce électronique et la gestion de la consommation énergétique des bâtiments.
Voici quelques-uns de mes principaux projets, réalisés dans le cadre de mon parcours en Data Science :
- Description : Analyse de données éducatives pour dégager des opportunités d'investissement.
- Description : Nettoyage et préparation de données pour une analyse avancée au sein d'un organisme de santé publique.
- Description : Développement d'un modèle de prévision des besoins énergétiques des bâtiments en utilisant des techniques de machine learning.
- Description : Segmentation de clients pour un site e-commerce, avec des recommandations personnalisées basées sur l'analyse des segments.
- Description : Implémentation de modèles de classification pour catégoriser automatiquement des produits de consommation.
- Description : Développement d'un modèle de scoring pour évaluer les clients en fonction de leur comportement d'achat.
- Description : Création d'un tableau de bord interactif pour le suivi des KPI et veille technologique.
- Description : Traitement de grandes quantités de données non structurées dans un environnement cloud.
- Description : Définition des objectifs et exigences pour un projet d'intelligence artificielle, en utilisant la méthodologie Agile Scrum.
- Python : Maîtrise de bibliothèques essentielles telles que Pandas, NumPy, Scikit-learn pour l'analyse de données et le Machine Learning.
- PySpark : Traitement de grandes quantités de données en utilisant l'API Python de Spark pour le Big Data.
- PyTorch : Développement de modèles de Deep Learning, incluant les réseaux de neurones convolutifs et récurrents.
- Apprentissage supervisé et non supervisé : Expérience avec des algorithmes comme la régression, les SVM, les arbres de décision, le clustering (K-means, DBSCAN).
- Deep Learning : Conception et optimisation de réseaux de neurones profonds avec PyTorch.
- Modèles de scoring et classification : Création de modèles prédictifs pour l'évaluation de risques, la segmentation de clients, etc.
- PySpark : Manipulation et analyse de données massives sur des clusters de calcul.
- Traitement de données sur le Cloud : Utilisation d'environnements cloud pour le traitement de données à grande échelle.
- Visualisation de données : Création de visualisations interactives avec Matplotlib, Seaborn, et Streamlit.
- Développement d'applications web : Utilisation de Flask et Streamlit pour développer des interfaces utilisateurs et dashboards interactifs.
- Git : Gestion de versions et collaboration sur des projets de data science.
- Jupyter Notebooks : Développement interactif de notebooks pour l'analyse de données et la modélisation.
- Evidently : Surveillance et analyse de la dérive des données (data drift) pour assurer la robustesse des modèles en production.
- Ollama : Utilisation d'outils pour la surveillance et l'explicabilité des modèles de machine learning.
- Serveur VPS sous YunoHost : Administration complète d'un serveur VPS personnel sous YunoHost, incluant le déploiement d'applications Flask pour héberger des projets web et data science.
- Environnements de développement : Expérience avec les environnements de développement en cloud, ainsi que l'utilisation de services (AWS) pour le déploiement de modèles.
Merci de visiter mon profil ! N'hésitez pas à me contacter pour discuter de mes projets ou pour toute opportunité de collaboration.