Thibault P.

Thibault P.

Followers of Thibault P.1000 followers
location of Thibault P.Toulouse, Occitanie, France

Connect with Thibault P. to Send Message

Connect

Connect with Thibault P. to Send Message

Connect
  • Timeline

  • About me

    Data Scientist Lead chez Laboratoires Pierre Fabre

  • Education

    • Diplôme d'ingénieur, ENSAI

      2011 - 2014
      M2 Statistics

      Activities and Societies: Membre de la Junior-Entreprise de l'ENSAI

    • Janson de Sailly

      2002 - 2011
      Baccalauréat Mathematics
  • Experience

    • ENSAI Junior Consultant

      Jan 2012 - Dec 2013

      Gérer les études confiées par les entreprises, notamment faire le lien entre l'étudiant statisticien faisant l'analyse et l'entreprise ; Veiller au bon déroulement de l'étude du point de vue statistique et légal Vérifier l'intégralité des documents émis dans la structure, d'un point de vue légal et pour assurer la pérennité de l'association

      • Chef de Projets

        Jan 2013 - Dec 2013
      • Responsable Contrôle Interne

        Jan 2012 - Dec 2012
    • TeamRecrut

      May 2012 - Jun 2012
      Assistant Marketing

      Recruter des profils parmi un large panel pour mener des études qualitatives pour le compte de grands groupes

    • MediaPrism

      Aug 2012 - Aug 2012
      Assistant Dataminer

      Assister le département statistique dans ses projets : Réalisation de scores d'appétence produit avec des données enrichies :- Création d'un modèle de manière automatisée avec l'outil Datalab- Sélection manuelle des variables pertinentes au regard d'indicateurs statistiques- Export du modèle de score pour calcul des appétences pour chaque client potentielAmélioration d'une segmentation RFM des clients La Poste :- Audit de la segmentation précédente- Analyse des profils créés- Modification manuelle- Description des profils ainsi obtenus Show less

    • OpinionWay

      Jun 2013 - Aug 2013
      Assistant chargé d'études statistiques

      - Estimation statistique paramétrique des reports de vote lors d'élections à 2 tours (via méthodes de Monte Carlo par Chaînes de Markov),- Réalisation de diverses études statistiques dans le cadre d'études d'opinion : caractérisation de classes obtenues par classification (appelée typologie), segmentation par arbre de décision,- Réflexion sur la mise en place d'une solution Big Data,- Rédaction de fiches de statistique servant d'aide-mémoire pour les statisticiens et d'explication pour les non-statisticiens. Show less

    • Groupe Karavel - Promovacances

      Dec 2013 - Jan 2014
      Chargé d'études datamining

      Réalisation d'une analyse des facteurs déterminants de la réservation d'un séjour sur Internet- Réflexion sur la problématique et sur l'apport de la modélisation- Création de la base éligible par des filtres métiers et statistiques- Modification et création des variables d'analyse- Modélisation par régression logistique, forêts aléatoires et SVM- Choix d'une méthode et présentation des résultats

    • Projet Etudiant

      Feb 2014 - Mar 2014
      Data Scientist

      Projet de prévision de la concentration en ozone dans Paris :- Contextualisation et motivation de l'étude- Récupération des données de concentration de type "open data"- Recherche documentaire sur la méthode non paramétrique du prédicteur à noyau- Utilisation d'autres méthodes de prévision (données publiques, séries temporelles)- Création de plusieurs indicateurs de qualité du modèle- Challenge et choix d'une méthode

    • Groupe AVISIA

      Apr 2014 - Dec 2024

      Formation en interne (slides + TP en R) sur les méthodes modernes d'apprentissage automatique (Random Forest, XGBoost)Mission chez AramisAuto, leader dans la vente et l'achats de véhicules neufs et d'occasionCréation et mise en production d'un algorithme dynamique de réajustement des prix- Definition du périmètre et de la cible à prédire- Récupération données dans Oracle et Redshift- Création de variables explicatives- Création d'un 1er modèle simple par arbre, puis mise en place d'un modèle XGBoost (tuning d'hyperparamètres)- Mise en place d'un scénario Dataiku automatique et quotidien pour appliquer le modèle (aucune étape manuelle à opérer)- Envoi aux services d'une liste d'identifiants de véhicules- Utilisation de l'API Googlesheets et du package Python gspread pour récupération des prix- Dashboard de suivi des performances du modèle et des gains réalisés sur Power BIChallenge interne sur les données du 1er groupe européen d'assurances : réalisation d'un score multi-classe de souscription à 7 produits d'assurance- Création, modification, sélection des variables- Modélisation par forêts aléatoires, gradient boosting, stackingOutils : R & RStudio / Résultats : 1erProjet interne de création d'un outil de rapprochement automatique entre une offre d'emploi et des CVs- Création d'un processus automatisé de rapprochement entre référentiels de mots et CVs/Offres avec PySpark- Réflexion sur les algorithmes d'auto-apprentissage Show less Mission chez Pages Jaunes (groupe Solocal), client leader dans la recherche d'information et la communication localesCréation de reportings pour les services d'Ooreka (filiale du groupe) :- Utilisation d'un datamart de données "cold", d'Ooreka, de PagesJaunes, d'AT Internet, d'un outil CRM- Cadrage des besoins- Vérification des indicateurs et réimplémentation des métriques- Création de reportings dans Tableau Software et publication sur le Web- Assurer la partie analytique du projet et faire le lien entre les prestataires techniques et les services OorekaAccompagnement dans la refonte du pricing de produits publicitaires :- Définition des indicateurs utiles (recherche, clic, CPC Google) et cadrage- Attribution d'un score aux activités par Analyse en Composantes Principales- Création de plusieurs clusters "étanches" d'activités professionnelles, par algorithme modifié des Moyennes MobilesCréation d'un outil de comparaison des performances des marques (positionnement et présence sur Google) :- Définition des objectifs et cadrage- Rédaction de spécifications fonctionnelles et techniques- Etudes quantitatives (corrélations, valeurs extrêmes, comptages, ...) pour valider les périmètres définis ou valoriser le projet en interne- Création d'indicateurs de performance- Livraison des datamarts pour intégration dans un environnement Hadoop et datavisualisation avec ZoomData Show less Projet principal : catégorisation intelligente de mots-clés recherchés sur Google pour le service SEO :- Nettoyage d'une base de mots-clés et création d'une base d'analyse propre pour l'analyse- Création d'une 1e catégorisation par moyennes mobiles- Regroupement automatique des classes par Classification Ascendante Hiérarchique et par regroupement manuel- Challenge des résultats par l'Analyse Sémantique Latente, méthode de text mining- Description des classes par la Valeur Test- Création d'indicateurs de qualité des modèles se basant sur la théorie des graphes- Tests de méthodes de text mining pour l'enrichissement des résultats- Comparaison statistique et opérationnelle des méthodes pour choisir la plus pertinente Show less

      • Data Scientist

        Oct 2016 - Dec 2024
      • Data Analyst

        Oct 2014 - Sept 2016
      • Stagiaire Datamining

        Apr 2014 - Sept 2014
    • Laboratoires Pierre Fabre

      Oct 2024 - now
      Lead Data Scientist
  • Licenses & Certifications