Portfolio

Système de Recommandation de Films

Développement d'un système de recommandation basé sur la similarité cosinus. Le modèle analyse le contenu textuel (résumé) pour suggérer des films thématiquement similaires, en utilisant des techniques NLP pour transformer le texte en vecteurs.

Python Scikit-learn NLP Cosine Similarity CountVectorizer Pandas

Solution Décisionnelle pour l'Analyse d'Activité

Développement d'une solution décisionnelle complète pour analyser l'activité d'une entreprise. Le projet a inclus l'intégration des données via un pipeline ETL (Talend), la modélisation d'un Datawarehouse, et la création d'un tableau de bord Power BI pour suivre des KPI clés comme le tunnel de conversion et la performance globale.

Power BI Talend ETL Data Warehouse Modélisation de données

Segmentation et Scoring Client

Pour optimiser les stratégies marketing, j'ai segmenté une base de 225 clients en trois profils (fidèles, occasionnels, distants) via une ACM et un clustering. J'ai ensuite développé un modèle de régression logistique (AUC = 0,951) pour prédire l'adhésion à un programme de fidélité, permettant un ciblage plus efficace.

R FactoMineR GLM Excel

Prévision des Immatriculations

Afin d'aider à la planification stratégique, j'ai conçu un modèle de régression linéaire pour prévoir les immatriculations de véhicules. Le projet a impliqué l'analyse de séries temporelles (tendance, saisonnalité) et une validation statistique rigoureuse pour assurer la fiabilité des prévisions.

SAS Excel

Dashboard Shiny : Coupe du Monde 2022

Développement d'une application Shiny de A à Z pour visualiser les données de la Coupe du Monde 2022. Le projet inclut un pipeline complet : de la collecte et du nettoyage des données jusqu'au déploiement d'une interface interactive offrant une expérience utilisateur riche.

R Shiny ggplot2
Voir l'application

Analyse de l'Abstention Électorale

Pour comprendre les facteurs de l'abstention électorale en France, j'ai mené une analyse économétrique en utilisant des données socio-économiques. L'étude a permis d'identifier les déterminants clés de ce phénomène, offrant des pistes de réflexion pour les politiques publiques.

SAS Excel

TruthLens : Analyse de la Véracité des Informations

Pour lutter contre la désinformation, j'ai développé TruthLens, une application Streamlit qui analyse la véracité d'articles. Le projet intègre un pipeline NLP complet (NLTK, TF-IDF) et un modèle Random Forest. Pour surmonter les défis de déploiement, j'ai conteneurisé l'application avec Docker et l'ai déployée sur Hugging Face Spaces.

Python Streamlit Pandas Scikit-learn Matplotlib NLTK Joblib Docker Hugging Face
Voir l'application