Vous êtes ici : Accueil > Big Data > Formation > Data Science (8) > Python pour la Data Science

Formation Python pour la Data Science


Objectifs

Apprendre à utiliser le langage Python et ses principales librairies scientifiques pour traiter, visualiser et modéliser les données en Data Science

Compétences visées

- Connaître et savoir utiliser les librairies incontournables de Python pour la data science : La Scipy Stack
- Connaître et utiliser les principales librairies de visualisation de données et notamment orientées cartographie
- Savoir manipuler des données volumineuses ne tenant pas en mémoire
- Avoir une bonne compréhension de l'écosystème scientifique de Python, savoir trouver ses librairies et juger de leur qualité

Public

Développeurs, chefs de projets, data scientists développant des applications scientifiques requérant d'importantes capacités de calculs

Pré-requis

Pour suivre ce stage dans de bonnes conditions, il est recommandé d'avoir suivi en amont la formation Python – Bases et introduction aux librairies scientifiques ou d'avoir atteint par la pratique un niveau équivalent

Méthode pédagogique

Nos formations sont majoritairement pratiques (70%), les concepts théoriques sont illustrés d’exemples et exercices. Les supports sont essentiellement construits avec les notebooks Jupyter/Lab et sont suffisamment détaillés pour être repris seul(e) après la formation.
Pédagogie active mêlant exposés, exercices et applications pratiques dans le logiciel Python.

Programme

- L'écosystème scientifique Python

Il n'est pas facile d'y voir clair dans l'écosystème scientifique de Python tant les librairies sont variées et nombreuses.
Cette présentation vous apportera une vue d'ensemble et les éléments clefs qui vous aideront à choisir vos librairies et outils de travail pour vos projets de data science avec Python.

  • Les incontournables: Numpy, Scipy, Pandas, Matplotlib et iPython qui sont le ciment de toutes les autres librairies scientifiques
  • Panorama des librairies et logiciels scientifiques par domaine
  • Les critères permettant de juger de la qualité d'une librairie

- Calculer avec des nombres réels: comprendre les erreurs de calculs

Les nombres réels, dans la plupart des langages, dont Python, utilisent la norme en virgule flottante.
Celle-ci n'est pas précise et peut générer des erreurs de calcul parfois bien gênantes.
  • La représentation des nombres réels
  • Comprendre les erreurs de calculs et les contourner

- La scipy stack

La librairie Numpy qui signifie Numeric Python est la première que vous devez apprendre. Elle constitue avec Scipy, Matplotlib et Pandas le socle sur lequel s'appuient toutes les autres librairies scientifiques.
  • Manipuler des tableaux de nombres: Numpy
    • Différences avec les listes Python
    • Création, sélection, filtres et principales fonctions
  • Visualiser ses données: Matplotlib
    • Les concepts de la librairie
    • Principaux graphiques: nuages de points, courbes, histogrammes, boxplot, ...
    • Fonctionnalités avancées: 3D, légendes, colorbar, manipuler les axes, annotations, ...
  • Analyse de données: Pandas
    • Les fondements de la librairie: Manipuler des données de type CSV et Excel
    • Séries et Dataframes
    • Index, sélection de données, filtres/recherche, agrégations, jointures et fonctions avancées
    • Manipuler des séries temporelles
  • Les fonctions mathématiques avancées: Scipy
    • Statistiques, optimisation, interpolations/régressions, traitement d'images

- Visualisation de données

Bien que Matplotlib constitue la première librairie de visualisation que vous devrez apprendre, elle possède 2 limites majeures: elle ne sait pas gérer les données volumineuses et n'est pas adaptée au Web. Mais Python a su développer un riche écosystème de visualisation de données qui devrait pouvoir répondre à toutes vos attentes.
  • Présentation de l'écosystème de visualisation de données de Python
  • Les librairies orientées Web: Bokeh, Altair et Plotly
  • Les "écosystèmes" PyViz et HoloViz
  • La visualisation de données volumineuses/big data avec DataShader
  • Les statistiques avec Seaborn

- Visualiser des données géospatiales

Posséder des données disposant de coordonnées géospatiales apporte une toute autre dimension à leur représentation. Python est très bien outillé dans ce domaine.
  • Convertir ses données d'un système de coordonnées à l'autre
  • Cartographie interactive "à la Open Street Map/Google Maps" avec Folium/iPyleaflet
  • Cartographie statique avec Cartopy
  • Autres librairies géospatiales

- Manipulation de données volumineuses

Numpy et Pandas sont 2 librairies incroyables, mais elles ont 2 limites majeures: elles ne savent pas traiter des données de très grande volumétrie qui ne tiennent pas en mémoire et ne savent pas toujours paralléliser leurs calculs.
Python a su développer des solutions.
  • Les librairies h5py, pytables, netcdf4, xarray, iris, parquet permettant de lire vos fichiers scientifiques
  • Paralléliser ses calculs avec Dask
  • Paralléliser ses calculs avec CuDF
  • Manipuler des dataframes gigantesques avec Dask

- Personnalisation

Sous réserve de contraintes techniques ou de confidentialité, nous vous proposons de personnaliser la formation en réalisant des exercices directement sur vos données métiers.

Modalités d'évaluation

Un formulaire d'auto-évaluation proposé en amont de la formation nous permettra d'évaluer votre niveau et de recueillir vos attentes. Ce même formulaire soumis en aval de la formation fournira une appréciation de votre progression.
Des exercices pratiques seront proposés à la fin de chaque séquence pédagogique pour l'évaluation des acquis.
En fin de formation, vous serez amené(e) à renseigner un questionnaire d'évaluation à chaud.
Une attestation de formation vous sera adressée à l'issue de la session.
Trois mois après votre formation, vous recevrez par email un formulaire d'évaluation à froid sur l'utilisation des acquis de la formation.

Pour aller plus loin

Nous vous recommandons la formation Machine Learning

Solutions de financement

Cette formation peut être financée :
  • dans le cadre du plan de développement des compétences de votre Entreprise
  • par l’OPCO (opérateur de compétences) de votre Entreprise ou le FAF (Fonds d’Assurance Formation) pour les professionnels libéraux
  • par Pôle Emploi dans le cadre du dispositif de l'Aide Individuelle à la Formation (soumis à accord de votre Agence)
  • à titre personnel

Accessibilité

Vous souhaitez suivre notre formation Python pour la Data Science et êtes en situation de handicap ? Merci de nous contacter afin que nous puissions envisager les adaptations nécessaires et vous garantir de bonnes conditions d'apprentissage

La formation Python pour la Data Science dans nos Centres ou en distanciel

  • Tarif : 3 000 € HT
    -10% dès 2 inscrits, -20% à partir de 3

  • Option(s) :
    - Forfait déjeuners : 100€ HT

Nos prochaines sessions

A distance

du 25 au 29 mars 2024

du 2 au 6 décembre 2024


Lyon

du 13 au 17 mai 2024

du 21 au 25 octobre 2024


Paris

du 17 au 21 juin 2024

du 18 au 22 novembre 2024


Toulouse

du 22 au 26 avril 2024

du 7 au 11 octobre 2024


Bordeaux | Lille | Marseille | Nantes | Nice | Strasbourg

Demandez l'ouverture d'une nouvelle session dès 2 collaborateurs intéressés
Demande d'ouverture d'une nouvelle session
Notre formation Python pour la Data Science vous intéresse mais vous n'êtes pas disponible aux dates proposées ?
Les lieux d'organisation ne vous conviennent pas ?
Faites-nous part de votre demande d'ouverture d'une nouvelle session dans l'une des 9 villes proposées.
Un conseiller vous confirmera au plus vite la possibilité d'ajout de cette nouvelle session.

    * : champ obligatoire

    Formation souhaitée *

    Ville souhaitée *

    Période de déroulement souhaitée

    Début :      

    Fin :      

    Votre message

    Nombre de participants *

    Vos coordonnées :

    Civilité *

    Votre prénom *

    Votre nom *

    Votre Société *

    Votre email *

    Votre téléphone

    Je souhaite recevoir par email :

    le catalogue formation (2 fois par an)des lettres d'information ponctuelles (6 par an au maximum)

    En soumettant ce formulaire, j'accepte que les informations saisies soient exploitées dans le cadre de la demande d'ouverture d'une nouvelle session de formation interentreprises et de la relation commerciale qui peut en découler

    Pour connaître et exercer vos droits, notamment de retrait de votre consentement à l'utilisation des données collectées par ce formulaire, veuillez consulter notre politique de confidentialité



    Plans d'accès / hébergements
    La formation Python pour la Data Science dans votre Entreprise ou en distanciel

    • Tarif : Nous consulter

    Demande de devis personnalisé
    Décrivez-nous votre projet au moyen du formulaire ci-dessous et recevez un devis personnalisé dans les meilleurs délais.

      * : champ obligatoire

      Formation souhaitée *

      Dans quel contexte s'inscrit ce projet ?

      Quels sont les objectifs de cette formation ?

      Nombre de participants

      Min : 

      Max :

      Quel est le profil des participants ?

      Quel logiciel est à votre disposition ?

      Une durée est-elle impartie pour cette formation ?

      Min :

      Max :

      Sur quelle période la formation pourrait-elle se dérouler ?

      Début :

      Fin :      

      S’agira-t-il d’une formation en distanciel ou en présentiel et si oui dans quelle ville ? *

      Des cas applicatifs de l’Entreprise pourront-ils être utilisés pour illustrer la formation ?

      Un ou plusieurs stagiaires sont-ils en situation de handicap et si oui des adaptations sont-elles à envisager ?

      Avez-vous des commentaires ?

      Vous pouvez nous adresser un fichier (cahier des charges, ...)

      Vos coordonnées :

      Civilité *

      Votre prénom *

      Votre nom *

      Votre Société *

      Votre email *

      Votre téléphone *

      Je souhaite recevoir par email :

      le catalogue formation (2 fois par an)des lettres d'information ponctuelles (6 par an au maximum)

      En soumettant ce formulaire, j'accepte que les informations saisies soient exploitées dans le cadre de la demande de devis pour une formation intra-entreprise et de la relation commerciale qui peut en découler

      Pour connaître et exercer vos droits, notamment de retrait de votre consentement à l'utilisation des données collectées par ce formulaire, veuillez consulter notre politique de confidentialité



      Date de dernière modification : 14/11/2023