Vous êtes ici : Accueil > Big Data > Formation > Data Science > Data Mining – Machine Learning

Formation Data Mining – Machine Learning


Objectifs

Découvrir les principales étapes d'une étude de Data Mining et un panorama des méthodes associées (Machine Learning, Analyse de Données). Apprendre à extraire de l’information utile à partir de données volumineuses, changeantes, non structurées.

Public

Décideurs, statisticiens, data scientists, chargés d’études en charge de l’exploitation des données de l’entreprise (marketing, gestion de la relation client, scoring, churn, ...)

Pré-requis

Pour suivre ce stage dans de bonnes conditions, il est recommandé d'avoir suivi en amont la formation Statistique descriptive (exploratoire) : savoir décrire des observations

Méthode

Mise en situation des participants devant des problèmes concrets issus de différents secteurs d'activité et appelant les méthodes d’analyses présentées. On évite de s’appesantir sur les aspects techniques pour privilégier l’analyse critique, le domaine d’application et les conditions d’utilisation des méthodes.
Pédagogie active mêlant exposés, exercices et applications pratiques.
Chaque participant pourra mettre en oeuvre les applications dans le logiciel de son choix parmi JMP ou R.

Programme

- Définitions du Data Mining
  • Le contexte du Data Mining : volume des données, nature des problèmes, mélange des disciplines
  • Définitions du Machine Learning et de l'Analyse de Données
  • L’histoire récente

- Le processus Data Mining
  • Les étapes du “Knowledge Discovery in Databases” (KDD)
  • Extraction, prétraitements et nettoyage
  • Analyses exploratoires
  • Visualisations
  • Modélisation
  • Analyse des résultats
  • Intégration
  • Échantillon d’apprentissage, de test et de validation

- Méthodes d’exploration graphique
  • Les analyses factorielles : composantes principales, correspondances simples et multiples
  • Les algorithmes de classification : arbres et centres mobiles
  • Les graphiques de Bertin

- Les réseaux de neurones
  • Principes des réseaux de neurones (perceptron)
  • Techniques de calculs
  • Applications à la résolution de nombreux problèmes dont la discrimination et la régression
  • Forces et faiblesses de l’approche

- Les arbres de décision
  • Principe des arbres
  • Les principaux algorithmes
  • Validation et élagage d’un arbre
  • Quelques exemples d’applications

- Les méthodes parcimonieuses
  • Régression pas à pas
  • Régression LASSO
  • Régression RIDGE
  • Elastic Net

- Les méthodes de ré-échantillonnage
  • Bagging
  • Boosting
  • Random Forest

- Le Text mining
  • Principe et méthodes du Text mining
  • Techniques factorielles, typologies et lexicométrie
  • Quelques applications : documents, messages électroniques, Internet, …

- Les principaux logiciels de Data Mining

- Bilan


Ce que pensent nos clients de la formation Data Mining – Machine Learning

M. Hiep N., médecin DIM au Centre Hospitalier de Rochefort
Bonne formation, dense et très utile
M. Rémi V., chef de projet scientifique et technique chez Exxelia Magnetics
Bonne formation, assez exhaustive
M. Julien F., ingénieur au CEA de Marcoule
Formation très instructive. Bonne pédagogie