Vous êtes ici : Accueil > Statistique > Formation > Logiciels de Statistique (19) > R pour la data analyse

Formation R pour la data analyse


Objectifs

S’approprier les outils, et les méthodes permettant de rendre son processus d’analyse de données sous R, aisé, reproductible, et performant.

Compétences visées

- Adopter une organisation efficace de son travail sous R
- Simplifier la manipulation de données avec le package dplyr
- Manipuler aisément les champs catégoriels (package forecats), textuels (package stringr) et de date (package lubridate)
- Assembler des tables par jointure (par colonnes) et par fusion (par lignes)
- Construire des graphiques élaborés grâce au package ggplot2
- Réaliser des documents automatisés à l'aide de Quarto
- Découvrir la programmation fonctionnelle au travers du package purrr

Public

Data Analysts, Data Scientists, Statisticiens et plus généralement toute personne intéressée par la Data Analyse avec R.

Pré-requis

Pour suivre ce stage dans de bonnes conditions, il est recommandé d'avoir suivi en amont la formation R – Prise en main, analyses statistiques et graphiques ou d'avoir atteint par la pratique un niveau équivalent

Méthode pédagogique

Pédagogie active mêlant exposés, exercices et applications pratiques dans le logiciel R.

Programme

- Organiser son travail sous R (2h)

  • Travailler en projet R : notion de working directory, workspace, history
  • Architecture de son projet R : data, plots, images, scripts, ...
  • Bonnes pratiques pour la création de fichiers de données
  • Importation et exportation de fichiers avec le package here
  • Mettre à jour ses packages
  • Mettre à jour R et R Studio

- Manipuler facilement ses données avec le package dplyr (3h)

  • Introduction au package tidyverse et à la notion de pipe
  • Filtrer des lignes avec la fonction filter()
  • Sélectionner des colonnes (variable) avec la fonction select()
  • Création de nouvelles variables avec la fonction mutate()
  • Renommer ses variables avec la fonction rename()
  • Calcul de paramètres par sous-groupes : fonctions group_by() et summarise()
  • Passage du format wide au format long
  • Exercices

- Manipulation des variables catégorielles avec le package forecats (1h)

  • Inspecter les variables catégorielles avec les fonctions levels(), fct_count et fct_unique
  • Modifier l’ordre des modalités
  • Modifier le nom des modalités
  • Exercices

- Manipuler les chaînes de caractères avec le package stringr (1h)

  • Détection de patterns
  • Découpage
  • Gestion des longueurs
  • Remplacement
  • Exercices

- Manipuler des données de date : utilisation du package lubridate (1h)

  • Convertir les données au format YYYY-MM-DD et HH:MM:SS
  • Décomposer les éléments d’année, de mois et de jour
  • Calculer des différences de dates et les exprimer en jours ou heures
  • Exercices

- Assemblage de tables (2h)

  • Les différentes jointures (par colonne): left join, right join, inner join et full join
  • Assemblage par lignes
  • Exemple d’applications pour l’analyse de données
  • Exercices

- Réaliser des représentations graphiques performantes avec le package ggplot2 (4h)

  • Le principe des couches successives de ggplot2
  • Réalisation des graphiques de base : scatterplot, barplots, line plot, boxplots
  • Gestion des couleurs, titres, axes et légendes
  • Représentation des séries temporelles
  • Utilisation du format long et facetting
  • Ajouter du texte sur un graphique (ex : équation)
  • Exporter son graphique : format et résolution
  • Utilisation des addins esquisse et Colour Picker

- Générer dynamiquement son rapport d’analyse avec Quarto (4h)

  • Principe, formats de sorties (html, docx, pdf)
  • La structure d'un script .qmd
  • Mise en forme des parties texte
  • Gestion de l'affichage du code et de son résultat
  • Importation de données
  • Insertion de graphiques, de tables, d'images
  • Gestion de la table des matières et numérotation
  • Les scripts paramétrés : automatisation de documents répétitifs

- Introduction à la programmation fonctionnelle avec le package purrr (2h)

  • Les list
  • Les fonctions map()
  • Nested data
  • Exercices

Projet tutoré

En option, réalisez en autonomie un projet vous permettant d'appliquer les principales notions de votre formation. Le formateur vous présentera la problématique proposée et suivra votre avancement au cours de 3 séances d'1h de tutorat individuel à distance.

Modalités d'évaluation

Un formulaire d'auto-évaluation proposé en amont de la formation nous permettra d'évaluer votre niveau et de recueillir vos attentes. Ce même formulaire soumis en aval de la formation fournira une appréciation de votre progression.
Des exercices pratiques seront proposés à la fin de chaque séquence pédagogique pour l'évaluation des acquis.
En fin de formation, vous serez amené(e) à renseigner un questionnaire d'évaluation à chaud.
Une attestation de formation vous sera adressée à l'issue de la session.
Trois mois après votre formation, vous recevrez par email un formulaire d'évaluation à froid sur l'utilisation des acquis de la formation.

Solutions de financement

Cette formation peut être financée :
  • dans le cadre du plan de développement des compétences de votre Entreprise
  • par l’OPCO (opérateur de compétences) de votre Entreprise ou le FAF (Fonds d’Assurance Formation) pour les professionnels libéraux
  • par France Travail dans le cadre du dispositif de l'Aide Individuelle à la Formation (soumis à accord de votre Agence)
  • à titre personnel

Accessibilité

Vous souhaitez suivre notre formation R pour la data analyse et êtes en situation de handicap ? Merci de nous contacter afin que nous puissions envisager les adaptations nécessaires et vous garantir de bonnes conditions d'apprentissage


Ce que pensent nos clients de la formation R pour la data analyse

Mme Elodie B., Attachée de recherche clinique - Data manager au Centre Léon Bérard
Formation très complète avec du contenu de qualité et des explications claires qui me seront très utiles dans ma pratique professionnelle
Mme Julie G., Analyste pricing chez Engie Entreprises et Collectivités
Formation complète, on utilise immédiatement et facilement ce qu'on a appris. Formatrice très pédagogue, supports très complets et bien structurés, qui servent au quotidien.

La formation R pour la data analyse dans nos Centres ou en distanciel

  • Tarif : 1 500 € HT
    -10% dès 2 inscrits, -20% à partir de 3

  • Option(s) :
    - Projet tutoré avec accompagnement individuel de 3h en distanciel : 450€ HT
    - Forfait déjeuners : 60€ HT

Nos prochaines sessions

A distance

du 24 au 26 juin 2024

du 9 au 11 décembre 2024


Lyon

du 23 au 25 septembre 2024


Paris

du 10 au 12 juin 2024

du 30 sept. au 2 oct. 2024

du 4 au 6 décembre 2024


Toulouse

du 18 au 20 novembre 2024


Bordeaux | Lille | Marseille | Nantes | Nice | Strasbourg

Demandez l'ouverture d'une nouvelle session dès 2 collaborateurs intéressés
Demande d'ouverture d'une nouvelle session
Notre formation R pour la data analyse vous intéresse mais vous n'êtes pas disponible aux dates proposées ?
Les lieux d'organisation ne vous conviennent pas ?
Faites-nous part de votre demande d'ouverture d'une nouvelle session dans l'une des 9 villes proposées.
Un conseiller vous confirmera au plus vite la possibilité d'ajout de cette nouvelle session.

    * : champ obligatoire

    Formation souhaitée *

    Ville souhaitée *

    Période de déroulement souhaitée

    Début :      

    Fin :      

    Votre message

    Nombre de participants *

    Vos coordonnées :

    Civilité *

    Votre prénom *

    Votre nom *

    Votre Société *

    Votre email *

    Votre téléphone

    Je souhaite recevoir par email :

    le catalogue formation (2 fois par an)des lettres d'information ponctuelles (6 par an au maximum)

    En soumettant ce formulaire, j'accepte que les informations saisies soient exploitées dans le cadre de la demande d'ouverture d'une nouvelle session de formation interentreprises et de la relation commerciale qui peut en découler

    Pour connaître et exercer vos droits, notamment de retrait de votre consentement à l'utilisation des données collectées par ce formulaire, veuillez consulter notre politique de confidentialité



    Plans d'accès / hébergements
    La formation R pour la data analyse dans votre Entreprise ou en distanciel

    • Tarif : Nous consulter

    • Option(s) :
      - Projet tutoré avec accompagnement individuel de 3h en distanciel : 450€ HT / pers.

    Demande de devis personnalisé
    Décrivez-nous votre projet au moyen du formulaire ci-dessous et recevez un devis personnalisé dans les meilleurs délais.

      * : champ obligatoire

      Formation souhaitée *

      Dans quel contexte s'inscrit ce projet ?

      Quels sont les objectifs de cette formation ?

      Nombre de participants

      Min : 

      Max :

      Quel est le profil des participants ?

      Quel logiciel est à votre disposition ?

      Une durée est-elle impartie pour cette formation ?

      Min :

      Max :

      Sur quelle période la formation pourrait-elle se dérouler ?

      Début :

      Fin :      

      S’agira-t-il d’une formation en distanciel ou en présentiel et si oui dans quelle ville ? *

      Des cas applicatifs de l’Entreprise pourront-ils être utilisés pour illustrer la formation ?

      Un ou plusieurs stagiaires sont-ils en situation de handicap et si oui des adaptations sont-elles à envisager ?

      Avez-vous des commentaires ?

      Vous pouvez nous adresser un fichier (cahier des charges, ...)

      Vos coordonnées :

      Civilité *

      Votre prénom *

      Votre nom *

      Votre Société *

      Votre email *

      Votre téléphone *

      Je souhaite recevoir par email :

      le catalogue formation (2 fois par an)des lettres d'information ponctuelles (6 par an au maximum)

      En soumettant ce formulaire, j'accepte que les informations saisies soient exploitées dans le cadre de la demande de devis pour une formation intra-entreprise et de la relation commerciale qui peut en découler

      Pour connaître et exercer vos droits, notamment de retrait de votre consentement à l'utilisation des données collectées par ce formulaire, veuillez consulter notre politique de confidentialité



      Date de dernière modification : 06/04/2024