Thibault P.

1000 followers

Toulouse, Occitanie, France

Connect with Thibault P. to Send Message

Connect

Connect with Thibault P. to Send Message

Connect

Timeline
About me
Data Scientist Lead chez Laboratoires Pierre Fabre
Education
- Diplôme d'ingénieur, ENSAI
  2011 - 2014
  M2 Statistics
  Activities and Societies: Membre de la Junior-Entreprise de l'ENSAI
- Janson de Sailly
  2002 - 2011
  Baccalauréat Mathematics
Experience
- ENSAI Junior Consultant
  Jan 2012 - Dec 2013
  Gérer les études confiées par les entreprises, notamment faire le lien entre l'étudiant statisticien faisant l'analyse et l'entreprise ; Veiller au bon déroulement de l'étude du point de vue statistique et légal Vérifier l'intégralité des documents émis dans la structure, d'un point de vue légal et pour assurer la pérennité de l'association
  - Chef de Projets
    Jan 2013 - Dec 2013
  - Responsable Contrôle Interne
    Jan 2012 - Dec 2012
- TeamRecrut
  May 2012 - Jun 2012
  Assistant Marketing
  Recruter des profils parmi un large panel pour mener des études qualitatives pour le compte de grands groupes
- MediaPrism
  Aug 2012 - Aug 2012
  Assistant Dataminer
  Assister le département statistique dans ses projets : Réalisation de scores d'appétence produit avec des données enrichies :- Création d'un modèle de manière automatisée avec l'outil Datalab- Sélection manuelle des variables pertinentes au regard d'indicateurs statistiques- Export du modèle de score pour calcul des appétences pour chaque client potentielAmélioration d'une segmentation RFM des clients La Poste :- Audit de la segmentation précédente- Analyse des profils créés- Modification manuelle- Description des profils ainsi obtenus Show less
- OpinionWay
  Jun 2013 - Aug 2013
  Assistant chargé d'études statistiques
  - Estimation statistique paramétrique des reports de vote lors d'élections à 2 tours (via méthodes de Monte Carlo par Chaînes de Markov),- Réalisation de diverses études statistiques dans le cadre d'études d'opinion : caractérisation de classes obtenues par classification (appelée typologie), segmentation par arbre de décision,- Réflexion sur la mise en place d'une solution Big Data,- Rédaction de fiches de statistique servant d'aide-mémoire pour les statisticiens et d'explication pour les non-statisticiens. Show less
- Groupe Karavel - Promovacances
  Dec 2013 - Jan 2014
  Chargé d'études datamining
  Réalisation d'une analyse des facteurs déterminants de la réservation d'un séjour sur Internet- Réflexion sur la problématique et sur l'apport de la modélisation- Création de la base éligible par des filtres métiers et statistiques- Modification et création des variables d'analyse- Modélisation par régression logistique, forêts aléatoires et SVM- Choix d'une méthode et présentation des résultats
- Projet Etudiant
  Feb 2014 - Mar 2014
  Data Scientist
  Projet de prévision de la concentration en ozone dans Paris :- Contextualisation et motivation de l'étude- Récupération des données de concentration de type "open data"- Recherche documentaire sur la méthode non paramétrique du prédicteur à noyau- Utilisation d'autres méthodes de prévision (données publiques, séries temporelles)- Création de plusieurs indicateurs de qualité du modèle- Challenge et choix d'une méthode
- Groupe AVISIA
  Apr 2014 - Dec 2024
  Formation en interne (slides + TP en R) sur les méthodes modernes d'apprentissage automatique (Random Forest, XGBoost)Mission chez AramisAuto, leader dans la vente et l'achats de véhicules neufs et d'occasionCréation et mise en production d'un algorithme dynamique de réajustement des prix- Definition du périmètre et de la cible à prédire- Récupération données dans Oracle et Redshift- Création de variables explicatives- Création d'un 1er modèle simple par arbre, puis mise en place d'un modèle XGBoost (tuning d'hyperparamètres)- Mise en place d'un scénario Dataiku automatique et quotidien pour appliquer le modèle (aucune étape manuelle à opérer)- Envoi aux services d'une liste d'identifiants de véhicules- Utilisation de l'API Googlesheets et du package Python gspread pour récupération des prix- Dashboard de suivi des performances du modèle et des gains réalisés sur Power BIChallenge interne sur les données du 1er groupe européen d'assurances : réalisation d'un score multi-classe de souscription à 7 produits d'assurance- Création, modification, sélection des variables- Modélisation par forêts aléatoires, gradient boosting, stackingOutils : R & RStudio / Résultats : 1erProjet interne de création d'un outil de rapprochement automatique entre une offre d'emploi et des CVs- Création d'un processus automatisé de rapprochement entre référentiels de mots et CVs/Offres avec PySpark- Réflexion sur les algorithmes d'auto-apprentissage Show less Mission chez Pages Jaunes (groupe Solocal), client leader dans la recherche d'information et la communication localesCréation de reportings pour les services d'Ooreka (filiale du groupe) :- Utilisation d'un datamart de données "cold", d'Ooreka, de PagesJaunes, d'AT Internet, d'un outil CRM- Cadrage des besoins- Vérification des indicateurs et réimplémentation des métriques- Création de reportings dans Tableau Software et publication sur le Web- Assurer la partie analytique du projet et faire le lien entre les prestataires techniques et les services OorekaAccompagnement dans la refonte du pricing de produits publicitaires :- Définition des indicateurs utiles (recherche, clic, CPC Google) et cadrage- Attribution d'un score aux activités par Analyse en Composantes Principales- Création de plusieurs clusters "étanches" d'activités professionnelles, par algorithme modifié des Moyennes MobilesCréation d'un outil de comparaison des performances des marques (positionnement et présence sur Google) :- Définition des objectifs et cadrage- Rédaction de spécifications fonctionnelles et techniques- Etudes quantitatives (corrélations, valeurs extrêmes, comptages, ...) pour valider les périmètres définis ou valoriser le projet en interne- Création d'indicateurs de performance- Livraison des datamarts pour intégration dans un environnement Hadoop et datavisualisation avec ZoomData Show less Projet principal : catégorisation intelligente de mots-clés recherchés sur Google pour le service SEO :- Nettoyage d'une base de mots-clés et création d'une base d'analyse propre pour l'analyse- Création d'une 1e catégorisation par moyennes mobiles- Regroupement automatique des classes par Classification Ascendante Hiérarchique et par regroupement manuel- Challenge des résultats par l'Analyse Sémantique Latente, méthode de text mining- Description des classes par la Valeur Test- Création d'indicateurs de qualité des modèles se basant sur la théorie des graphes- Tests de méthodes de text mining pour l'enrichissement des résultats- Comparaison statistique et opérationnelle des méthodes pour choisir la plus pertinente Show less
  - Data Scientist
    Oct 2016 - Dec 2024
  - Data Analyst
    Oct 2014 - Sept 2016
  - Stagiaire Datamining
    Apr 2014 - Sept 2014
- Laboratoires Pierre Fabre
  Oct 2024 - now
  Lead Data Scientist
Licenses & Certifications
- La programmation en R
  Coursera Verified Certificates
  Aug 2015
  View certificate
- Creating New BigQuery Datasets and Visualizing Insights
  Coursera
  May 2019
  View certificate
- Google Cloud Platform Big Data and Machine Learning
  Coursera
  May 2019
  View certificate
- Exploring and Preparing your Data with BigQuery
  Coursera
  May 2019
  View certificate
- Applying Machine Learning to your Data with GCP
  Coursera
  May 2019
  View certificate
- Achieving Advanced Insights with BigQuery
  Coursera
  May 2019
  View certificate
- Introduction à R
  DataCamp
  View certificate
- SAS Base Programming
  SAS
  Dec 2014
  View certificate
- SAS Certified Predictive Modeler Using SAS Enterprise Miner 13
  SAS
  Dec 2016
  View certificate
- SAS Statistical Analyst
  SAS
  Dec 2015

Thibault P.

Timeline

About me

Education

Diplôme d'ingénieur, ENSAI

Janson de Sailly

Experience

ENSAI Junior Consultant

Chef de Projets

Responsable Contrôle Interne

TeamRecrut

MediaPrism

OpinionWay

Groupe Karavel - Promovacances

Projet Etudiant

Groupe AVISIA

Data Scientist

Data Analyst

Stagiaire Datamining

Laboratoires Pierre Fabre

Licenses & Certifications

La programmation en R

Creating New BigQuery Datasets and Visualizing Insights

Google Cloud Platform Big Data and Machine Learning

Exploring and Preparing your Data with BigQuery

Applying Machine Learning to your Data with GCP

Achieving Advanced Insights with BigQuery

Introduction à R

SAS Base Programming

SAS Certified Predictive Modeler Using SAS Enterprise Miner 13

SAS Statistical Analyst

Languages

Recommendations

Spencer mitchell

Mujtahid ahsan sabbir

James curry

Makenzie scott

Mohan bhide

Vicki-lynn ward

Ishwari modak

Murali banka

Matthew deakin

Dimitrios tsontos

Julie estes

Rakshit raval

Abdulaziz al-thobaiti

Alexander sumin

Christopher jordan

Richard medeiros

Guillem esponella masana

Jeffrey jolly

Marc montroy

Chung yew wai