Portfolio
Système de Recommandation de Films
Développement d'un système de recommandation basé sur la similarité cosinus. Le modèle analyse le contenu textuel (résumé) pour suggérer des films thématiquement similaires, en utilisant des techniques NLP pour transformer le texte en vecteurs.
Solution Décisionnelle pour l'Analyse d'Activité
Développement d'une solution décisionnelle complète pour analyser l'activité d'une entreprise. Le projet a inclus l'intégration des données via un pipeline ETL (Talend), la modélisation d'un Datawarehouse, et la création d'un tableau de bord Power BI pour suivre des KPI clés comme le tunnel de conversion et la performance globale.
Segmentation et Scoring Client
Pour optimiser les stratégies marketing, j'ai segmenté une base de 225 clients en trois profils (fidèles, occasionnels, distants) via une ACM et un clustering. J'ai ensuite développé un modèle de régression logistique (AUC = 0,951) pour prédire l'adhésion à un programme de fidélité, permettant un ciblage plus efficace.
Prévision des Immatriculations
Afin d'aider à la planification stratégique, j'ai conçu un modèle de régression linéaire pour prévoir les immatriculations de véhicules. Le projet a impliqué l'analyse de séries temporelles (tendance, saisonnalité) et une validation statistique rigoureuse pour assurer la fiabilité des prévisions.
Dashboard Shiny : Coupe du Monde 2022
Développement d'une application Shiny de A à Z pour visualiser les données de la Coupe du Monde 2022. Le projet inclut un pipeline complet : de la collecte et du nettoyage des données jusqu'au déploiement d'une interface interactive offrant une expérience utilisateur riche.
Analyse de l'Abstention Électorale
Pour comprendre les facteurs de l'abstention électorale en France, j'ai mené une analyse économétrique en utilisant des données socio-économiques. L'étude a permis d'identifier les déterminants clés de ce phénomène, offrant des pistes de réflexion pour les politiques publiques.
TruthLens : Analyse de la Véracité des Informations
Pour lutter contre la désinformation, j'ai développé TruthLens, une application Streamlit qui analyse la véracité d'articles. Le projet intègre un pipeline NLP complet (NLTK, TF-IDF) et un modèle Random Forest. Pour surmonter les défis de déploiement, j'ai conteneurisé l'application avec Docker et l'ai déployée sur Hugging Face Spaces.