Vous êtes ici : Accueil > Big Data > Formation > Technologies du Big Data > Python pour le Big Data

Formation Python pour le Big Data


Objectifs

Connaître les problématiques du Big Data
Connaître les différentes librairies Python permettant de manipuler le Big Data
Savoir manipuler de grands volumes de données
Avoir des notions sur l’architecture Big Data

Public

Architectes, développeurs, data scientists, chefs de projet, ...

Pré-requis

Pour suivre ce stage dans de bonnes conditions, il est recommandé d'avoir suivi en amont la formation Python – Bases et introduction aux librairies scientifiques ou d'avoir atteint par la pratique un niveau équivalent

Méthode pédagogique

Pédagogie active mêlant exposés, exercices et applications pratiques dans le logiciel Python.

Modalités d'évaluation

Un formulaire d'auto-évaluation proposé en amont de la formation nous permettra d'évaluer votre niveau et de recueillir vos attentes. Ce même formulaire soumis en aval de la formation fournira une appréciation de votre progression.
Des exercices pratiques seront proposés à la fin de chaque séquence pédagogique pour l'évaluation des acquis.
En fin de formation, vous serez amené(e) à renseigner un questionnaire d'évaluation à chaud.
Une attestation de formation vous sera adressée à l'issue de la session.
Trois mois après votre formation, vous recevrez par email un formulaire d'évaluation à froid sur l'utilisation des acquis de la formation.

Accessibilité

Vous souhaitez suivre notre formation Python pour le Big Data et êtes en situation de handicap ? Merci de nous contacter afin que nous puissions envisager les adaptations nécessaires et vous garantir de bonnes conditions d'apprentissage

Programme

- Concepts du Big Data
Cette introduction permet de vous initier à la problématique du Big Data
  • Volume, Vitesse, Véracité
  • Map Reduce
  • Architecture Big Data et Data Lake
  • Big Data et Cloud computing
  • Les outils du Big Data

- Introduction à la librairie Dask
Dask est une librairie qui permet de faire du calcul distribué sur plusieurs cœurs ou plusieurs machines avec la possibilité d’utiliser un scheduler. Dask peut donc accélérer le calcul sur de larges volumes de données.
  • Présentation de Dask
  • Exemple de calculs distribués
  • Dask et Numpy: comparaison de performances
  • Dask et Pandas

- Introduction à la librairie Xarray
Xarray est une librairie Python qui s’appuie sur Numpy et permet de manipuler de larges volumes de données. Cette librairie est particulièrement efficace pour des fichiers netCDF et peut s’utiliser de concert avec Dask
  • Présentation de Xarray
  • Exemples d’utilisation de Xarray
  • Mise en pratique avec un fichier netCDF

- Introduction à la librairie Vaex
Vaex est une librairie qui ressemble beaucoup à pandas mais qui fait des calculs à la volée sans gaspiller l’usage de la RAM. On peut dès lors traiter des données qui ont près de 1 milliard de lignes à la seconde.
  • Présentation de Vaex
  • Prise en main de Vaex avec des exemples
  • Comparaison entre Vaex et Pandas
  • Visualisation des données avec Vaex

- Introduction à Spark
Spark est un outil permettant le passage à l’échelle pour la gestion des données et le calcul distribué. Bien que géré par Apache, Spark est en Open Source et peut s’utiliser avec plusieurs langages dont Python
  • Présentation de Spark
  • Architecture Apache Spark
  • Autres outils associés à Spark (Yarn, Mesos)
  • Resilient Distributed Dataset (RDD)
  • Présentation et Installation de PySpark

- Introduction à PySpark
Vous verrez grâce une mise en pratique sur une journée la prise en main de PySpark, comment lire et gérer des données, comment appliquer des fonctions sur les données et comment appliquer une réduction de dimension

- Visualisation des données massives avec Holoviews
Manipuler des gros volumes de données n’est pas toujours suffisants, on veut pouvoir aussi les visualiser. La librairie Holoviews permet aussi bien de transformer des données massives que de les visualiser.
  • Présentation et prise en main d’Holoviews
  • Interactivité avec Holoviews


La formation Python pour le Big Data dans nos Centres ou en distanciel

  • Tarif : 3 000 € HT
    -10% dès 2 inscrits, -20% à partir de 3

Nos prochaines sessions

A distance

du 4 au 8 juillet 2022

du 14 au 18 novembre 2022


Lyon

du 12 au 16 décembre 2022


Paris

du 20 au 24 juin 2022

du 5 au 9 décembre 2022


Toulouse

du 3 au 7 octobre 2022


Bordeaux | Lille | Marseille | Nantes | Nice | Strasbourg

Demandez l'ouverture d'une nouvelle session dès 2 collaborateurs intéressés
Demande d'ouverture d'une nouvelle session Notre formation Python pour le Big Data vous intéresse mais vous n'êtes pas disponible aux dates proposées ?
Les lieux d'organisation ne vous conviennent pas ?
Faites-nous part de votre demande d'ouverture d'une nouvelle session dans l'une des 9 villes proposées.
Pour cela, votre demande doit concerner au moins 2 personnes et la session doit être planifiée dans un délai minimal de 3 mois.
Un conseiller vous confirmera au plus vite l'ajout de cette nouvelle session.

    * : champ obligatoire

    Formation souhaitée

    Ville souhaitée

    Date de démarrage souhaitée

    Votre message

    Nombre de participants

    Vos coordonnées :

    Civilité *

    Votre prénom *

    Votre nom *

    Votre Société *

    Votre email *

    Votre téléphone *

    Je souhaite recevoir par email :
    le catalogue formation (2 fois par an)des lettres d'information ponctuelles (6 par an au maximum)

    En soumettant ce formulaire, j'accepte que les informations saisies soient exploitées dans le cadre de la demande d'ouverture d'une nouvelle session de formation interentreprises et de la relation commerciale qui peut en découler

    Pour connaître et exercer vos droits, notamment de retrait de votre consentement à l'utilisation des données collectées par ce formulaire, veuillez consulter notre politique de confidentialité



    Plans d'accès / hébergements
    La formation Python pour le Big Data dans votre Entreprise ou en distanciel

    Vous avez un projet ? Décrivez-le nous au moyen du formulaire ci-dessous et recevez un devis personnalisé dans les meilleurs délais.

      Votre projet :

      * : champ obligatoire

      Formation souhaitée *

      Nombre de participants
      Min : 
      Max :

      Lieu de la formation *

      Logiciel statistique à votre disposition

      Période souhaitée
      Début :
      Fin :      

      Vos commentaires

      Envoyez-nous un fichier (cahier des charges, ...)

      Vos coordonnées :

      Civilité *

      Votre prénom *

      Votre nom *

      Votre Société *

      Votre email *

      Votre téléphone *

      Je souhaite recevoir par email :
      le catalogue formation (2 fois par an)des lettres d'information ponctuelles (6 par an au maximum)

      En soumettant ce formulaire, j'accepte que les informations saisies soient exploitées dans le cadre de la demande de devis pour une formation intra-entreprise et de la relation commerciale qui peut en découler

      Pour connaître et exercer vos droits, notamment de retrait de votre consentement à l'utilisation des données collectées par ce formulaire, veuillez consulter notre politique de confidentialité



      Date de dernière modification : 06/04/2022