
Thibault P.

Connect with Thibault P. to Send Message
Connect
Connect with Thibault P. to Send Message
ConnectTimeline
About me
Data Scientist Lead chez Laboratoires Pierre Fabre
Education

Diplôme d'ingénieur, ENSAI
2011 - 2014M2 StatisticsActivities and Societies: Membre de la Junior-Entreprise de l'ENSAI

Janson de Sailly
2002 - 2011Baccalauréat Mathematics
Experience

ENSAI Junior Consultant
Jan 2012 - Dec 2013Gérer les études confiées par les entreprises, notamment faire le lien entre l'étudiant statisticien faisant l'analyse et l'entreprise ; Veiller au bon déroulement de l'étude du point de vue statistique et légal Vérifier l'intégralité des documents émis dans la structure, d'un point de vue légal et pour assurer la pérennité de l'association
Chef de Projets
Jan 2013 - Dec 2013Responsable Contrôle Interne
Jan 2012 - Dec 2012

TeamRecrut
May 2012 - Jun 2012Assistant MarketingRecruter des profils parmi un large panel pour mener des études qualitatives pour le compte de grands groupes

MediaPrism
Aug 2012 - Aug 2012Assistant DataminerAssister le département statistique dans ses projets : Réalisation de scores d'appétence produit avec des données enrichies :- Création d'un modèle de manière automatisée avec l'outil Datalab- Sélection manuelle des variables pertinentes au regard d'indicateurs statistiques- Export du modèle de score pour calcul des appétences pour chaque client potentielAmélioration d'une segmentation RFM des clients La Poste :- Audit de la segmentation précédente- Analyse des profils créés- Modification manuelle- Description des profils ainsi obtenus Show less

OpinionWay
Jun 2013 - Aug 2013Assistant chargé d'études statistiques- Estimation statistique paramétrique des reports de vote lors d'élections à 2 tours (via méthodes de Monte Carlo par Chaînes de Markov),- Réalisation de diverses études statistiques dans le cadre d'études d'opinion : caractérisation de classes obtenues par classification (appelée typologie), segmentation par arbre de décision,- Réflexion sur la mise en place d'une solution Big Data,- Rédaction de fiches de statistique servant d'aide-mémoire pour les statisticiens et d'explication pour les non-statisticiens. Show less

Groupe Karavel - Promovacances
Dec 2013 - Jan 2014Chargé d'études dataminingRéalisation d'une analyse des facteurs déterminants de la réservation d'un séjour sur Internet- Réflexion sur la problématique et sur l'apport de la modélisation- Création de la base éligible par des filtres métiers et statistiques- Modification et création des variables d'analyse- Modélisation par régression logistique, forêts aléatoires et SVM- Choix d'une méthode et présentation des résultats

Projet Etudiant
Feb 2014 - Mar 2014Data ScientistProjet de prévision de la concentration en ozone dans Paris :- Contextualisation et motivation de l'étude- Récupération des données de concentration de type "open data"- Recherche documentaire sur la méthode non paramétrique du prédicteur à noyau- Utilisation d'autres méthodes de prévision (données publiques, séries temporelles)- Création de plusieurs indicateurs de qualité du modèle- Challenge et choix d'une méthode

Groupe AVISIA
Apr 2014 - Dec 2024Formation en interne (slides + TP en R) sur les méthodes modernes d'apprentissage automatique (Random Forest, XGBoost)Mission chez AramisAuto, leader dans la vente et l'achats de véhicules neufs et d'occasionCréation et mise en production d'un algorithme dynamique de réajustement des prix- Definition du périmètre et de la cible à prédire- Récupération données dans Oracle et Redshift- Création de variables explicatives- Création d'un 1er modèle simple par arbre, puis mise en place d'un modèle XGBoost (tuning d'hyperparamètres)- Mise en place d'un scénario Dataiku automatique et quotidien pour appliquer le modèle (aucune étape manuelle à opérer)- Envoi aux services d'une liste d'identifiants de véhicules- Utilisation de l'API Googlesheets et du package Python gspread pour récupération des prix- Dashboard de suivi des performances du modèle et des gains réalisés sur Power BIChallenge interne sur les données du 1er groupe européen d'assurances : réalisation d'un score multi-classe de souscription à 7 produits d'assurance- Création, modification, sélection des variables- Modélisation par forêts aléatoires, gradient boosting, stackingOutils : R & RStudio / Résultats : 1erProjet interne de création d'un outil de rapprochement automatique entre une offre d'emploi et des CVs- Création d'un processus automatisé de rapprochement entre référentiels de mots et CVs/Offres avec PySpark- Réflexion sur les algorithmes d'auto-apprentissage Show less Mission chez Pages Jaunes (groupe Solocal), client leader dans la recherche d'information et la communication localesCréation de reportings pour les services d'Ooreka (filiale du groupe) :- Utilisation d'un datamart de données "cold", d'Ooreka, de PagesJaunes, d'AT Internet, d'un outil CRM- Cadrage des besoins- Vérification des indicateurs et réimplémentation des métriques- Création de reportings dans Tableau Software et publication sur le Web- Assurer la partie analytique du projet et faire le lien entre les prestataires techniques et les services OorekaAccompagnement dans la refonte du pricing de produits publicitaires :- Définition des indicateurs utiles (recherche, clic, CPC Google) et cadrage- Attribution d'un score aux activités par Analyse en Composantes Principales- Création de plusieurs clusters "étanches" d'activités professionnelles, par algorithme modifié des Moyennes MobilesCréation d'un outil de comparaison des performances des marques (positionnement et présence sur Google) :- Définition des objectifs et cadrage- Rédaction de spécifications fonctionnelles et techniques- Etudes quantitatives (corrélations, valeurs extrêmes, comptages, ...) pour valider les périmètres définis ou valoriser le projet en interne- Création d'indicateurs de performance- Livraison des datamarts pour intégration dans un environnement Hadoop et datavisualisation avec ZoomData Show less Projet principal : catégorisation intelligente de mots-clés recherchés sur Google pour le service SEO :- Nettoyage d'une base de mots-clés et création d'une base d'analyse propre pour l'analyse- Création d'une 1e catégorisation par moyennes mobiles- Regroupement automatique des classes par Classification Ascendante Hiérarchique et par regroupement manuel- Challenge des résultats par l'Analyse Sémantique Latente, méthode de text mining- Description des classes par la Valeur Test- Création d'indicateurs de qualité des modèles se basant sur la théorie des graphes- Tests de méthodes de text mining pour l'enrichissement des résultats- Comparaison statistique et opérationnelle des méthodes pour choisir la plus pertinente Show less
Data Scientist
Oct 2016 - Dec 2024Data Analyst
Oct 2014 - Sept 2016Stagiaire Datamining
Apr 2014 - Sept 2014

Laboratoires Pierre Fabre
Oct 2024 - nowLead Data Scientist
Licenses & Certifications
- View certificate

La programmation en R
Coursera Verified CertificatesAug 2015 - View certificate

Creating New BigQuery Datasets and Visualizing Insights
CourseraMay 2019 - View certificate

Google Cloud Platform Big Data and Machine Learning
CourseraMay 2019 - View certificate

Exploring and Preparing your Data with BigQuery
CourseraMay 2019 - View certificate

Applying Machine Learning to your Data with GCP
CourseraMay 2019 - View certificate

Achieving Advanced Insights with BigQuery
CourseraMay 2019 - View certificate

Introduction à R
DataCamp - View certificate

SAS Base Programming
SASDec 2014 - View certificate

SAS Certified Predictive Modeler Using SAS Enterprise Miner 13
SASDec 2016 
SAS Statistical Analyst
SASDec 2015
Languages
- anAnglais
Recommendations

Spencer mitchell
President & Partner at Thoroughbred Aviation, LLC.®Atlanta, Georgia, United States
Mujtahid ahsan sabbir
Consultant QMS, ISMS || Lead Auditor ISMS || CEH || Comptia A+ || CCNA 200-301 ||MCSA || RHCSA, RHCE...Mohammadpur Thana, Dhaka, Bangladesh
James curry
Director, Structured Finance at NatWestBirmingham, England, United Kingdom
Makenzie scott
Senior Campaign Manager at FreeformLos Angeles, California, United States
Mohan bhide
Director of R&D at iCarol (Harris Computer)Greater Vancouver Metropolitan Area
Vicki-lynn ward
YOUTH MENTOR/COUNSELOR, S.A.P. MEMBER FOR INCARCERATED MOTHERS.ANIMAL BREEDER,DENTAL ASSISTANT, PAST...Los Angeles Metropolitan Area
Ishwari modak
Associate Manager at PGD- Publicis Media | Programmatic | E-commerceماهاراشترا مدينة بوني الهند
Murali banka
Enterprise ArchitectSayreville, New Jersey, United States
Matthew deakin
Planning and Priorities Coordinator at Department of National DefenceDartmouth, Nova Scotia, Canada
Dimitrios tsontos
Learning & Development People Manager at Amazon | M.Sc. | B.Sc.Bratislava, Slovakia
Julie estes
Writer and Content CreatorLexington, South Carolina, United States
Rakshit raval
AVP at HDFC BankMumbai, Maharashtra, India
Abdulaziz al-thobaiti
Cybersecurity Engineer- C|EH | eJPT | SEC+ | CSAP | CySA+ | Qualys certified | ISO27001 lead impleme...Riyadh, Saudi Arabia
Alexander sumin
Директор филиала в компании Торговый Дом ПоляковUkraine
Christopher jordan
Development Manager-Classic Center Cultural FoundationAthens, Georgia, United States
Richard medeiros
Experienced Sales Professional - Chemical & Bioanalytical | Pharmaceutical | Food & Beverage | Indus...Greater Boston
Guillem esponella masana
International Project Manager, Business Development, EMBA, Industrial Engineer, B2B, B2C, Geographic...Barcelona, Catalonia, Spain
Jeffrey jolly
Product Manager at BMO Financial GroupToronto, Ontario, Canada
Marc montroy
Manager, Trainer, Educator, Team BuilderAustin, Texas Metropolitan Area
Chung yew wai
Director at Chef WongGreater Melbourne Area
...