Objectifs
Apprendre à identifier les différents types de données manquantes, connaître les méthodes de traitement disponibles, mettre en œuvre des applications pratiques dans R.
Public
Toute personne confrontée à la présence de données manquantes dans ses fichiers de travail.
Méthode
Pédagogie active mêlant exposés, exercices et applications pratiques dans le logiciel R.
Programme
- Problématique générale
- Les grands types de données manquantes
- État des lieux des données manquantes
- Panorama des différentes stratégies de traitement des données manquantes
- L’exclusion
- L’imputation simple
- L’imputation multiple
- Bilan
- Origine des données manquantes
- Impact sur les analyses
- Les grands types de données manquantes
- MCAR (Missing Completely At Random)
- MAR (Missing At Random)
- MNAR (Missing Not At Random)
- État des lieux des données manquantes
- Détecter, synthétiser, lister les individus ou variables avec données manquantes
- Pattern de données manquantes
- Panorama des différentes stratégies de traitement des données manquantes
- L’exclusion
- L’imputation simple
- Par la moyenne
- A l’aide d’un modèle
- Par les k plus proches voisins
- L’imputation multiple
- Bilan