Vous êtes ici : Accueil > Big Data > Formation > Data Science > Machine Learning et Analyse de Données

Formation Machine Learning et Analyse de Données


Objectifs

Découvrir les principales étapes d'une étude de Data Science et un panorama des méthodes associées (Machine Learning, Analyse de Données). Apprendre à extraire de l’information utile à partir de données volumineuses, changeantes, non structurées.

Public

Décideurs, statisticiens, data scientists, chargés d’études en charge de l’exploitation des données de l’entreprise (marketing, gestion de la relation client, scoring, churn, ...)

Pré-requis

Pour suivre ce stage dans de bonnes conditions, il est recommandé d'avoir suivi en amont la formation Statistique descriptive (exploratoire) : savoir décrire des observations

Méthode

Mise en situation des participants devant des problèmes concrets issus de différents secteurs d'activité et appelant les méthodes d’analyses présentées. On évite de s’appesantir sur les aspects techniques pour privilégier l’analyse critique, le domaine d’application et les conditions d’utilisation des méthodes.
Pédagogie active mêlant exposés, exercices et applications pratiques.
Chaque participant pourra mettre en oeuvre les applications dans le logiciel de son choix parmi JMP ou R.

Programme

- Définitions de la Data Science
  • Le contexte de la Data Science : volume des données, nature des problèmes, mélange des disciplines
  • Définitions du Machine Learning et de l'Analyse de Données
  • L’histoire récente

- Le processus Data Science
  • Les étapes du “Knowledge Discovery in Databases” (KDD)
  • Extraction, prétraitements et nettoyage
  • Analyses exploratoires
  • Visualisations
  • Modélisation
  • Analyse des résultats
  • Intégration
  • Échantillon d’apprentissage, de test et de validation

- Méthodes d’exploration graphique
  • Les analyses factorielles : composantes principales, correspondances simples et multiples
  • Les algorithmes de classification : arbres et centres mobiles
  • Les graphiques de Bertin

- Les réseaux de neurones
  • Principes des réseaux de neurones (perceptron)
  • Techniques de calculs
  • Applications à la résolution de nombreux problèmes dont la discrimination et la régression
  • Forces et faiblesses de l’approche

- Les arbres de décision
  • Principe des arbres
  • Les principaux algorithmes
  • Validation et élagage d’un arbre
  • Quelques exemples d’applications

- Les méthodes parcimonieuses
  • Régression pas à pas
  • Régression LASSO
  • Régression RIDGE
  • Elastic Net

- Les méthodes de ré-échantillonnage
  • Bagging
  • Boosting
  • Random Forest

- Le Text mining
  • Principe et méthodes du Text mining
  • Techniques factorielles, typologies et lexicométrie
  • Quelques applications : documents, messages électroniques, Internet, …

- Les principaux logiciels de Data Science

- Bilan


Ce qu'en pensent nos clients

M. Hiep N., médecin DIM au Centre Hospitalier de Rochefort
Bonne formation, dense et très utile
M. Rémi V., chef de projet scientifique et technique chez Exxelia Magnetics
Bonne formation, assez exhaustive
M. Julien F., ingénieur au CEA de Marcoule
Formation très instructive. Bonne pédagogie