Objectifs
S’approprier les outils, et les méthodes permettant de rendre son processus d’analyse de données sous R, aisé, reproductible, et performant.
Compétences visées
- Adopter une organisation efficace de son travail sous R
- Importer et nettoyer ses données avant analyse
- Simplifier la manipulation de données avec le package dplyr
- Manipuler aisément les champs catégoriels (package forecats), textuels (package stringr) et de date (package lubridate)
- Assembler des tables par jointure (par colonnes) et par fusion (par lignes)
- Construire des graphiques élaborés grâce au package ggplot2
- Réaliser des documents automatisés à l'aide de Quarto
- Importer et nettoyer ses données avant analyse
- Simplifier la manipulation de données avec le package dplyr
- Manipuler aisément les champs catégoriels (package forecats), textuels (package stringr) et de date (package lubridate)
- Assembler des tables par jointure (par colonnes) et par fusion (par lignes)
- Construire des graphiques élaborés grâce au package ggplot2
- Réaliser des documents automatisés à l'aide de Quarto
Public
Data Analysts, Data Scientists, Statisticiens et plus généralement toute personne intéressée par la Data Analyse avec R.
Pré-requis
Pour suivre ce stage dans de bonnes conditions, il est recommandé d'avoir suivi en amont la formation R – Prise en main, analyses statistiques et graphiques ou d'avoir atteint par la pratique un niveau équivalent
Méthode pédagogique
Pédagogie active mêlant exposés, exercices et applications pratiques dans le logiciel R.
Programme
- Organisation de son travail sous R
- Création de projet R
- Architecture du projet R
- Versionnage des scripts en local avec git
- Importations et nettoyage
- Accélération et automatisation des importations
- Uniformisation des noms des variables
- Création de labels
- Suppression des espaces
- Gestion des doublons
- Nettoyage et corrections diverses
- Manipulations avancées des data frame
- Introduction au package tidyverse
- Création de subsets, ajout de variables, transformation de variables
- Création de tables aggrégées par groupe
- Autres manipulations utiles
- Jointure de tables à l’aide d’une clé primaire
- Assemblage de tables de même structure
- Passage en format long et wide
- Gestion des variables de type factor avec forecats
- Afficher et renommer les niveaux
- Modifier l’ordre des niveaux manuellement et automatiquement
- Réaliser des regroupements de niveaux automatiquement
- Gestion des variables de types chaînes de caractères
- Découpage, recherche, suppression, remplacement de pattern avec le package stringr
- Création de chaîne de caractères complexes avec le package glue
- Initiation aux expression régulières
- Gestion des données de dates et d’heures avec lubridate
- Conversion d’une chaîne de caractères en date
- Extraction de différents éléments d’une date
- Diverses manipulations : calcul de délais, arrondi, ...
- Initiation au reporting avec Quarto
- Principe
- Premiers éléments : titre, texte, code, graphiques, tables
- Améliorations : numérotation, table des matières, légende et renvois
- Réalisation de graphiques avec ggplot2
- Principe du package
- Premiers graphiques de type scatterplot
- Gestion des couleurs, forme, taille, courbe de tendance
- Division en plusieurs sous fenêtre
- Autres types de graphiques
Modalités d'évaluation
Un formulaire d'auto-évaluation proposé en amont de la formation nous permettra d'évaluer votre niveau et de recueillir vos attentes. Ce même formulaire soumis en aval de la formation fournira une appréciation de votre progression.
Des exercices pratiques seront proposés à la fin de chaque séquence pédagogique pour l'évaluation des acquis.
En fin de formation, vous serez amené(e) à renseigner un questionnaire d'évaluation à chaud.
Une attestation de formation vous sera adressée à l'issue de la session.
Trois mois après votre formation, vous recevrez par email un formulaire d'évaluation à froid sur l'utilisation des acquis de la formation.
Des exercices pratiques seront proposés à la fin de chaque séquence pédagogique pour l'évaluation des acquis.
En fin de formation, vous serez amené(e) à renseigner un questionnaire d'évaluation à chaud.
Une attestation de formation vous sera adressée à l'issue de la session.
Trois mois après votre formation, vous recevrez par email un formulaire d'évaluation à froid sur l'utilisation des acquis de la formation.
Solutions de financement
Cette formation peut être financée :
- dans le cadre du plan de développement des compétences de votre Entreprise
- par l’OPCO (opérateur de compétences) de votre Entreprise ou le FAF (Fonds d’Assurance Formation) pour les professionnels libéraux
- par France Travail dans le cadre du dispositif de l'Aide Individuelle à la Formation (soumis à accord de votre Agence)
- à titre personnel
Accessibilité
Vous souhaitez suivre notre formation R pour la data analyse et êtes en situation de handicap ? Merci de nous contacter afin que nous puissions envisager les adaptations nécessaires et vous garantir de bonnes conditions d'apprentissage
Ce que pensent nos clients de la formation R pour la data analyse
Mme Elodie B., Attachée de recherche clinique - Data manager au Centre Léon Bérard
Formation très complète avec du contenu de qualité et des explications claires qui me seront très utiles dans ma pratique professionnelle
Mme Julie G., Analyste pricing chez Engie Entreprises et Collectivités
Formation complète, on utilise immédiatement et facilement ce qu'on a appris. Formatrice très pédagogue, supports très complets et bien structurés, qui servent au quotidien.
Mme Cécile O., Chef de projets en santé publique chez CRCDC AURA
Formation d'une grande utilité dans les points abordés. Formateur au top