La gestion des bases de données Linux est une tâche qui nécessite de disposer des meilleurs utilitaires alliant performances, sécurité, évolutivité et compatibilité avec d'autres applications ou modules complémentaires. Pour cette raison, si nous travaillons sur des bases de données, nous chercherons toujours à ce que cette plate-forme où nous entrons et gérons les données nous offre cela et plus, c'est pourquoi Apache Cassandra a été développé et dans Solvetic nous expliquerons ce que c'est, ce que c'est les principaux avantages sont et comment nous pouvons l'installer dans Ubuntu 20.04.
Qu'est-ce qu'Apache CassandraApache Cassandra a été développé en tant que gestionnaire de base de données qui nous donne des aspects clés tels que l'évolutivité et la haute disponibilité, mais avec des performances adéquates quelle que soit la taille des bases de données avec lesquelles travailler.
Apache Cassandra a une réplication des données sur plusieurs centres de données offrant non seulement une disponibilité mais une latence beaucoup plus faible.
Il a une architecture distribuée, c'est-à-dire qu'il permet de gérer de gros volumes de données avec une réplication dynamique, c'est pourquoi les répliques sont stockées dans plusieurs nœuds d'un cluster ajoutant une meilleure tolérance aux pannes.
Fonctions Apache CassandraApache Cassandra a été construit comme une base de données NoSQL open source, il nous donne un modèle de stockage cohérent, c'est pourquoi Apache Cassandra est idéal pour les environnements où des aspects tels que :
- Requêtes ciblant les clés partitionnées
- Réplication complète de la base de données multimaître
- Disponibilité globale avec une faible latence
- Augmentation des performances linéaires de chaque processeur
- Régime flexible
Composants Apache CassandraApache Cassandra intègre Cassandra Query Language (CQL), c'est un langage identique à SQL avec lequel nous pouvons créer et mettre à jour le schéma de la base de données et accéder aux données, il est composé d'aspects tels que :
- Keyspace : ceux-ci définissent la façon dont un ensemble de données est répliqué.
- Partition : cette option indique où les lignes Apache Cassandra seront dans la clé primaire.
- Table : elle est chargée de définir le schéma écrit pour une collection de partitions.
- Ligne : elles hébergent une collection de colonnes identifiées par une clé primaire.
- Colonne : fait référence à une seule donnée avec un type associé à une ligne.
Les paramètres de configuration d'Apache Cassandra sont configurés directement dans le fichier cassandra.yaml.
Fonctionnalités d'Apache CassandraCertaines des nouvelles fonctionnalités d'Apache Cassandra sont :
- Prise en charge de Java 11
- Gestion des tables virtuelles
- Journal complet des requêtes
- Utiliser Nodetool pour activer la piste d'audit
- Affichage des journaux d'audit
- Messagerie interne améliorée
- Diffusion améliorée
- Transmission zéro copie
- La réplication transitoire prend en charge EACH_QUORUM et plus
Systèmes Apache CassandraApacha Cassandra peut être installé sur les systèmes suivants :
- Ubuntu 16.04 à 20.04
- CentOS et RedHat Enterprise Linux (RHEL) incluant 6.6, 7.7 et 8
- AMI Amazon Linux 2016.09 à Linux 2
- Debian 8, 9 et 10
- SUSE Enterprise Linux 12
Voyons comment installer Apache Cassandra sur Ubuntu 20.04.
1. Installer Apache Cassandra sur Ubuntu 20.04
Étape 1
Tout d'abord, nous devons valider la version Java car OpenJDK permet à Apache Cassandra de fonctionner sans problème, pour valider cela nous exécutons :
java -version
AGRANDIR
Étape 2
Nous installons OpenJDK 8 avec la commande suivante :
sudo apt installer openjdk-8-jdk
AGRANDIR
Étape 3
Nous entrons la lettre S pour confirmer le téléchargement et l'installation. Ensuite, nous pouvons exécuter à nouveau "java -version" pour vérifier la version utilisée de Java.
:
AGRANDIR
Étape 4
Avec OpenJDK installé dans Ubuntu 20.04, nous pouvons installer Apache Cassandra, nous allons d'abord installer le package "apt-transport-https" avec la commande suivante, cela permet d'accéder aux référentiels via le protocole HTTP :
sudo apt installer apt-transport-https
AGRANDIR
Étape 5
Nous allons maintenant importer la clé GPG avec la commande suivante :
wget -q -O - https://www.apache.org/dist/cassandra/KEYS | sudo apt-key ajouter -
AGRANDIR
Étape 6
Nous ajoutons le référentiel Apache Cassandra au fichier système :
sudo sh -c 'echo "deb http: //www.apache.or … assandra/debian 311x main">
/etc/apt/sources.list.d/cassandra.list'
AGRANDIR
Étape 7
Nous mettons à jour le système afin que les référentiels soient mis à jour en cas de nouvelles :
mise à jour sudo apt
AGRANDIR
Étape 8
après cela, nous installons la base de données Cassandra :
sudo apt installer cassandra
AGRANDIR
Étape 9
Nous entrons la lettre S pour terminer le processus :
AGRANDIR
Étape 10
Apache Cassandra démarrera automatiquement et nous pourrons valider son statut avec la commande suivante :
sudo systemctl statut cassandra
AGRANDIR
Étape 11
Nous pouvons maintenant valider l'état du nœud avec la commande suivante. Cela nous permet de voir l'état du nœud de Cassandra.
état du nœud sudo
AGRANDIR
Étape 12
On se connecte à Apache Cassandra avec la commande suivante :
cqlsh
AGRANDIR
2. Configurer Apache Cassandra sur Ubuntu 20.04
Dans Cassandra, les fichiers de configuration se trouvent dans le répertoire /etc/cassandra et les données sont stockées dans le répertoire /var/lib/cassandra, toutes les options de démarrage sont disponibles pour être modifiées dans le fichier /etc/default/cassandra.
Étape 1
Lors de la connexion, nous pouvons voir que le nom par défaut du cluster est « Test Cluster », pour le modifier, nous nous connectons à Apache Cassandra avec « cqlsh », puis nous saisissons ce qui suit :
UPDATE system.local SET cluster_name = 'Cluster Solvetique' WHERE KEY = 'local';
Étape 2
Puis nous sommes sortis avec
SORTIR;
AGRANDIR
Étape 3
On accède au fichier de configuration à l'aide de l'éditeur souhaité :
sudo nano /etc/cassandra/cassandra.yamlÉtape 4
Nous verrons ce qui suit :
AGRANDIR
Étape 5
Là, nous allons à la ligne "cluster_name" et nous entrons le nom que nous avons attribué précédemment :
AGRANDIR
Étape 6
Nous enregistrons les modifications à l'aide de la combinaison de touches suivante :
Ctrl + O
Nous quittons l'éditeur en utilisant :
Ctrl + X
Étape 7
Lorsque vous vous reconnectez à Apache Cassandra, nous verrons le nouveau nom du cluster :
AGRANDIR
Avec Solvetic, vous avez appris à installer et à configurer Apache Cassandra pour gérer les données de manière beaucoup plus complète.