Vous êtes ici : Accueil > Big Data > Formation > Technologies du Big Data > NoSQL : ElasticSearch

Formation NoSQL : ElasticSearch


Objectifs

Savoir intégrer ses données dans l'outil d'indexation "full-text" Elasticsearch, connaitre son langage d'interrogation et concevoir son propre modèle de données

Public

Le cours s'adresse aux architectes, développeurs, data scientists et chefs de projet

Pré-requis

La connaissance d'un langage comme Java, Python ou PHP est recommandée, la pratique du "shell" est un plus.

Méthode

Pédagogie active mêlant exposés, exercices et applications pratiques

Programme

- Introduction
  • Généralités
  • Historique du projet
  • Quelques mots sur Lucene
  • Les "plus" de Elasticsearch (ES)

- Les bases d'ElasticSearch
  • Principes de fonctionnement
  • Installation
  • Configuration de base
  • Vue générale de l'API REST
  • Noeud, Index et Type

- Indexation de documents
  • Conception des index
  • Indexer les documents
  • Mise à jour et suppression d'un document indexé
  • Versions
  • Pondération

- Mapping
  • Définition et rôle du mapping
  • Types de champs
  • Champs prédéfinis
  • Méta-données d'un index

- Analyse et extraction de texte
  • Analyser, découper et filtrer
  • Support des langues étrangères
  • Suppression des mots "inutiles"
  • Suppression des balises
  • Extraction d'URL et email
  • Correction orthographique
  • Intégration de Apache Tika

- Recherche de documents
  • Types de requêtes
    • query_string, match, range
    • term, bool, fuzzy, wildcard
  • Types de filtres
  • Gérer la pertinence des résultats

- Recherches avancées
  • Les suggestions
  • Les agrégations
    • terms, range, histogram, min/max/avg, statistiques, géographiques
    • Recherche géospatiale

- Fonctionnalités avancées
  • Autres types de plugins
  • La "percolation"
  • Ingestion de documents
  • Performances
  • Modélisation des données

- Utilisation de Kibana
  • Installation
  • Découverte des Index
  • Interrogations
  • Agrégations et Graphes