Bases de Données NoSQL avec Cassandra¶
Objectifs¶
- Installer Cassandra et créer une base de données
- Interroger une base de données orientée colonnes
- Protéger la base de données contre les pannes avec la Réplication
- Passer à l'échelle avec le Sharding
Ressources¶
Outils
- Docker
- Jupyter Notebook
Fichiers de données (datasets)
Sources et référence
Présentation de Cassandra¶
Cassndra est un SGDB NoSQL de la catégorie orientée colonne ou Wide Column. Il figure parmi les SGBD les plus utilisé et le premier de la catégorie Wide column.
Source : https://db-engines.com/en/ranking_trend/wide+column+store
Source : https://db-engines.com/en/ranking_trend
Architecture¶
Un cluster Cassandra est un système distribué organisé selon un modèle peer-to-peer sous la forme d'un anneau logique.
Cassandra met en oeuvre les techniques de réplication et partitionnement de données afin de garantir la haute disponibilité et la résistance aux pannes.
Il offre la possibilité de configurer la cohérence par requête.
Cassandra est utilisé, en l'associant avec d'autres frameworks, par de grandes entreprises (IBM, Ebay, Spotify, Instagram, ...). La description des différentes architectures et critères de choix sont décrits dans ces études de cas