Aller au contenu

Bases de Données NoSQL avec Cassandra


Objectifs

  • Installer Cassandra et créer une base de données
  • Interroger une base de données orientée colonnes
  • Protéger la base de données contre les pannes avec la Réplication
  • Passer à l'échelle avec le Sharding

Ressources

Outils

  • Docker
  • Jupyter Notebook

Fichiers de données (datasets)

Sources et référence

Présentation de Cassandra

Cassndra est un SGDB NoSQL de la catégorie orientée colonne ou Wide Column. Il figure parmi les SGBD les plus utilisé et le premier de la catégorie Wide column.

Source : https://db-engines.com/en/ranking_trend/wide+column+store

Source : https://db-engines.com/en/ranking_trend

Architecture

Un cluster Cassandra est un système distribué organisé selon un modèle peer-to-peer sous la forme d'un anneau logique.

Cassandra met en oeuvre les techniques de réplication et partitionnement de données afin de garantir la haute disponibilité et la résistance aux pannes.

Il offre la possibilité de configurer la cohérence par requête.

Cassandra est utilisé, en l'associant avec d'autres frameworks, par de grandes entreprises (IBM, Ebay, Spotify, Instagram, ...). La description des différentes architectures et critères de choix sont décrits dans ces études de cas