Objectifs
Structurer et optimiser l'utilisation de R pour l’analyse de données, en adoptant des bonnes pratiques de travail, de manipulation et de nettoyage des données, ainsi que de reporting reproductible.
Compétences visées
- Organiser et structurer efficacement leur travail sous R à l’aide de projets clairs et de scripts lisibles
- Mettre en place un versionnage des scripts afin de sécuriser et tracer l’évolution des analyses
- Importer des données de manière robuste, en automatisant et en accélérant les importations de fichiers tabulaires
- Nettoyer des données de façon systématique et reproductible (uniformisation des variables, gestion des doublons, corrections et contrôles de cohérence)
- Enchaîner les étapes de manipulation des données nécessaires à l’analyse (sélection, transformation, agrégation, jointures, changement de format)
- Gérer différents types de variables (facteurs, chaînes de caractères, dates) de manière fiable
- Produire des analyses descriptives et des visualisations adaptées aux données et aux objectifs
- Automatiser la production de résultats et de rapports dynamiques avec Quarto
- Améliorer la lisibilité, la maintenabilité et la réutilisation de leur code R
- Mettre en place un versionnage des scripts afin de sécuriser et tracer l’évolution des analyses
- Importer des données de manière robuste, en automatisant et en accélérant les importations de fichiers tabulaires
- Nettoyer des données de façon systématique et reproductible (uniformisation des variables, gestion des doublons, corrections et contrôles de cohérence)
- Enchaîner les étapes de manipulation des données nécessaires à l’analyse (sélection, transformation, agrégation, jointures, changement de format)
- Gérer différents types de variables (facteurs, chaînes de caractères, dates) de manière fiable
- Produire des analyses descriptives et des visualisations adaptées aux données et aux objectifs
- Automatiser la production de résultats et de rapports dynamiques avec Quarto
- Améliorer la lisibilité, la maintenabilité et la réutilisation de leur code R
Public
Data Analysts, Data Scientists, Statisticiens et plus généralement toute personne intéressée par la Data Analyse avec R.
Pré-requis
Pour suivre ce stage dans de bonnes conditions, il est recommandé d'avoir suivi en amont la formation R – Prise en main, analyses statistiques et graphiques ou d'avoir atteint par la pratique un niveau équivalent
Méthode pédagogique
Pédagogie active mêlant exposés, exercices et applications pratiques dans le logiciel R.
Programme
- Structurer son travail sous R
Mettre en place un environnement de travail structuré et fiable sous R à l’aide de projets et du versionnage des scripts- Création et structuration de projets R
- Architecture des projets et bonnes pratiques
- Versionnage des scripts en local avec git
- Reporting reproductible avec Quarto
Produire des analyses et des rapports reproductibles en structurant des documents dynamiques avec Quarto- Principes du reporting reproductible
- Premiers éléments : texte, code, tableaux et graphiques
- Structuration d’un document Quarto
- Numérotation, table des matières, légendes et renvois
- Importation avancée des données
Importer des données de manière robuste en automatisant et en optimisant les importations- Gestion des problèmes d'encodage
- Accélération des importations
- Automatisation des importations de fichiers CSV et Excel
- Manipulations avancées des data frame
Savoir manipuler et transformer des tables de données en enchaînant les opérations courantes nécessaires à l’analyse à l’aide du tidyverse- Introduction au méta-package tidyverse
- Création de sous-ensembles, ajout et transformation de variables
- Création de tables agrégées par groupe
- Autres manipulations utiles
- Nettoyage de données
Mettre en œuvre une démarche rigoureuse et reproductible de nettoyage des données afin d’en assurer la qualité, la cohérence et la fiabilité avant toute analyse- Uniformisation des noms des variables
- Création de labels
- Gestion des doublons
- Nettoyage et corrections diverses
- Manipulations supplémentaires
Savoir combiner et restructurer des tables de données à l’aide de jointures, d’assemblages et de changements de format afin de préparer les données pour l’analyse- Jointure de tables à l’aide d’une clé primaire
- Assemblage de tables de même structure
- Passage en format long et wide
- Travailler avec différents types de variables et s’initier à la programmation fonctionnelle
Gérer efficacement les principaux types de variables et s’initier à la programmation fonctionnelle pour automatiser des traitements simples- Variables catégorielles avec forcats
- Chaînes de caractères avec stringr et glue
- Dates et heures avec lubridate
- Initiation à la programmation fonctionnelle avec purrr (quelques exemples)
- Réalisation de graphiques avec ggplot2
Réaliser des graphiques adaptés aux données et aux objectifs d’analyse à l’aide du package ggplot2- Principe du package
- Premiers graphiques (scatterplots, ...)
- Gestion des couleurs, formes, tailles et courbes de tendance
- Découpage en sous-fenêtres
- Autres types de graphiques
Modalités d'évaluation
Un formulaire d'auto-évaluation proposé en amont de la formation nous permettra d'évaluer votre niveau et de recueillir vos attentes. Ce même formulaire soumis en aval de la formation fournira une appréciation de votre progression.
Des exercices pratiques seront proposés à la fin de chaque séquence pédagogique pour l'évaluation des acquis.
En fin de formation, vous serez amené(e) à renseigner un questionnaire d'évaluation à chaud.
Une attestation de formation vous sera adressée à l'issue de la session.
Trois mois après votre formation, vous recevrez par email un formulaire d'évaluation à froid sur l'utilisation des acquis de la formation.
Des exercices pratiques seront proposés à la fin de chaque séquence pédagogique pour l'évaluation des acquis.
En fin de formation, vous serez amené(e) à renseigner un questionnaire d'évaluation à chaud.
Une attestation de formation vous sera adressée à l'issue de la session.
Trois mois après votre formation, vous recevrez par email un formulaire d'évaluation à froid sur l'utilisation des acquis de la formation.
Qualification du formateur
Les formations DATA VALUE sont animées par des intervenants experts, alliant expérience opérationnelle et compétences pédagogiques reconnues.
Ils disposent de plus de 10 ans d’expérience professionnelle et assurent une veille constante sur les pratiques, outils et normes de leur domaine afin de garantir des contenus actualisés et adaptés aux besoins des stagiaires.
Ils disposent de plus de 10 ans d’expérience professionnelle et assurent une veille constante sur les pratiques, outils et normes de leur domaine afin de garantir des contenus actualisés et adaptés aux besoins des stagiaires.
Pour aller plus loin
Nous vous recommandons la formation R pour la Data Analyse avancée
Solutions de financement
Cette formation peut être financée :
- dans le cadre du plan de développement des compétences de votre Entreprise
- par l’OPCO (opérateur de compétences) de votre Entreprise ou le FAF (Fonds d’Assurance Formation) pour les professionnels libéraux
- par France Travail dans le cadre du dispositif de l'Aide Individuelle à la Formation (soumis à accord de votre Agence)
- Ã titre personnel
Délais d'accès et modalités de formation
Les inscriptions peuvent être effectuées jusqu’à 48 heures avant le début de la formation.
Vous pourrez trouver des informations plus détaillées concernant les modalités de nos formations à cette adresse : https://www.datavalue.fr/modalites-acces-formation
Vous pourrez trouver des informations plus détaillées concernant les modalités de nos formations à cette adresse : https://www.datavalue.fr/modalites-acces-formation
Accessibilité
Vous souhaitez suivre notre formation R pour la Data Analyse et êtes en situation de handicap ? Merci de nous contacter afin que nous puissions envisager les adaptations nécessaires et vous garantir de bonnes conditions d'apprentissage
Ce que pensent nos clients de la formation R pour la Data Analyse
Mme Elodie B., Attachée de recherche clinique - Data manager au Centre Léon Bérard
Formation très complète avec du contenu de qualité et des explications claires qui me seront très utiles dans ma pratique professionnelle
Mme Julie G., Analyste pricing chez Engie Entreprises et Collectivités
Formation complète, on utilise immédiatement et facilement ce qu'on a appris. Formatrice très pédagogue, supports très complets et bien structurés, qui servent au quotidien.
Mme Cécile O., Chef de projets en santé publique chez CRCDC AURA
Formation d'une grande utilité dans les points abordés. Formateur au top
Mme Sandy C., Ingénieure en bioinformatique chez Genoscreen
La formation a été très enricihssante et la formatrice très pédagogue. Elle a pris le temps de répondre à des questions sur des points plus techniques pour approfondir certains sujets. Le rythme était adapté, ni trop rapide, ni trop lent, ce qui a permis d'assimiler l'ensemble des notions abordées et de les mettre en pratique.
