Les bases de données sont un élément fondamental pour travailler sur de grandes quantités de données grâce à leur dynamisme, leur hiérarchie, leur paramétrage et leur simplicité de gestion.
Aujourd'hui, nous avons la possibilité de sélectionner différentes bases de données telles que MySQL, MariaDB, etc., et chacune a ses avantages et ses paramètres en fonction du nombre d'utilisateurs et de paramètres à travailler, mais aujourd'hui, nous allons parler d'une en particulier appelée Cassandra la ce qui peut être très utile lorsque l'on travaille avec une base de données et pour cela nous utiliserons CentOS 7.
Qu'est-ce que CassandreCassandra est une base de données open source conçue pour l'évolutivité et la haute disponibilité sans compromettre les performances globales du système.
Cassandra possède des facteurs tels que l'évolutivité linéaire et la tolérance aux pannes dans le matériel de base ou l'infrastructure cloud qui en font la plate-forme idéale pour les données critiques. La prise en charge de Cassandra pour la réplication sur plusieurs centres de données est la meilleure de sa catégorie, garantissant une latence plus faible pour les utilisateurs tout en améliorant les niveaux de performances globales.
Cassandra est une base de données qui prend en charge la réplication locale et la réplication de plusieurs centres de données pour la redondance, le basculement et la reprise après sinistre.
Caractéristiques CassandreCertaines de ses caractéristiques sont :
- Disponibilité : La base de données Cassandra est reconnue pour sa fiabilité au point qu'elle est utilisée par plus de 1000 entreprises dans le monde, parmi lesquelles on peut citer Instagram, GitHub, Netflix, avec lesquels nous pouvons utiliser Cassandra en toute confiance.
- Tolérance aux pannes : un point critique dans toute base de données est la disponibilité des informations et, à cet égard, Cassandra a une large tolérance aux pannes, dans laquelle nous sommes tous exposés à souffrir, en permettant à toutes les données qui y sont stockées d'avoir la capacité d'être automatiquement répliqués dans d'autres nœuds, garantissant à la fois leur intégrité et leur disponibilité. De plus, lorsqu'un nœud présente un certain type d'erreur, il peut être remplacé sans qu'il soit nécessaire de désactiver la base de données, ce qui affecte l'opérabilité et la productivité des utilisateurs.
- Performance : Un point en faveur de Cassandra est sa haute performance grâce à laquelle il est possible d'aller à un niveau supérieur aux plateformes NoSQL déjà connues tant au niveau de la gestion qu'au niveau applicatif.
- Décentralisé : Une autre caractéristique qui se démarque dans Cassandra est son administration décentralisée grâce à laquelle chaque nœud impliqué dans la base de données est unique, évitant ainsi des pannes massives.
- Évolutif: Un point à considérer dans une base de données est sa capacité d'évolutivité car cela permet qu'à mesure que l'entreprise se développe, la base de données ne soit pas limitée dans son action, c'est pourquoi Cassandra est l'une des meilleures options puisque, selon ses statistiques, elle a le capacité à prendre en charge jusqu'à plus de 2000 nœuds, plus de 400 To de données et environ 1 milliard, voire plus, de requêtes chaque jour, ce qui garantit sa large portée.
- Durable : Un autre aspect à prendre en compte lors de la sélection de la base de données avec laquelle travailler est sa capacité de durabilité, cela implique que la base de données doit avoir la capacité de permettre aux données critiques de rester toujours disponibles quel que soit le type de panne qui se produit, cela garantit la une gestion optimale et correcte de chacune des données qui y sont stockées.
- Options de contrôle : Avec la base de données Cassandra, nous avons diverses options d'administration telles que la réplication synchrone ou asynchrone, en cas d'utilisation de l'option de gestion asynchrone, nous aurons une base de données qui prend en charge des fonctions supplémentaires telles que Hinted Handoff et Read Repair pour étendre ses capacités d'utilisation.
1. Mettre à jour le système et installer Java sur CentOS 7
Étape 1
La première étape consiste à mettre à jour le système d'exploitation, cela peut être fait en exécutant la commande suivante :
sudo miam mise à jour -yÉtape 2
Cassandra est écrit en Java, il faudra donc installer Java sur CentOS 7 en exécutant la commande suivante :
sudo yum installer java -y
Étape 3
Nous pouvons vérifier la version Java installée en exécutant la commande suivante :
sudo java -version
2. Installer Cassandra sur CentOS 7
Étape 1
Par défaut, la base de données Cassandra n'est pas disponible dans le référentiel par défaut de CentOS 7 pour cette raison, il sera nécessaire d'ajouter les référentiels officiels Apache Software Foundation à CentOS 7, et ceci est réalisé en créant le fichier cassandra.repo dans le répertoire /etc/yum.repos.d comme suit:
sudo nano /etc/yum.repos.d/cassandra.repoÉtape 2
Dans ce nouveau fichier créé, nous ajouterons les éléments suivants :
[cassandra] name = DataStax Repo pour Apache Cassandra baseurl = http://rpm.datastax.com/community enabled = 1 gpgcheck = 0
Étape 3
Nous sauvegardons les modifications à l'aide de la combinaison de touches
Ctrl + O
et on sort de l'éditeur à l'aide des touches
Ctrl + X
Étape 4
Maintenant, il faudra mettre à jour les packages dans le référentiel en exécutant la commande suivante :
sudo miam mise à jour -yÉtape 5
Nous pouvons maintenant installer Cassandra en exécutant la commande suivante :
sudo yum installer dsc20 -y
AGRANDIR
Étape 6
Une fois téléchargé et installé, nous verrons ce qui suit :
AGRANDIR
Étape 7
Une fois Cassandra installé, nous procédons à l'exécution des commandes suivantes :
sudo systemctl start cassandra (Démarrer le service Cassandra) sudo systemctl enable cassandra (Activer le service Cassandra au démarrage du système)
AGRANDIR
Étape 8
Enfin, nous pouvons voir le statut de Cassandra en exécutant la commande suivante :
sudo systemctl statut cassandra
AGRANDIR
3. Connectez et vérifiez le cluster Cassandra sur CentOS 7
Étape 1
À ce stade, Cassandra fonctionne, nous allons donc vérifier et connecter le cluster Cassandra, pour cela, tout d'abord, nous allons vérifier l'état du cluster Cassandra avec la commande suivante :
état du nœud sudo
Étape 2
Nous pouvons voir que l'état de la connexion au cluster est correct. À ce stade, Solvetic souhaite ajouter un point de solution car à plusieurs reprises lors de l'exécution de cette commande, l'erreur suivante s'affiche :
Erreur : Échec de la connexion à « 127.0.0.1:7199 » : connexion refusée (Cassandra)Étape 3
Pour résoudre cette erreur et accéder correctement, nous devons aller dans le répertoire suivant à l'aide de l'éditeur souhaité :
sudo nano /etc/cassandra/default.conf/cassandra-env.shÉtape 4
Là, nous devons localiser la ligne suivante:
JVM_OPTS = "$ JVM_OPTS -Djava.rmi.server.hostname =Étape 5
L'apparence doit être similaire au texte suivant :
# ajoutez ceci si vous rencontrez des problèmes de connexion : # JVM_OPTS = ”$ JVM_OPTS -Djava.rmi.server.hostname =”Étape 6
Là, nous devons décommenter la deuxième ligne et remplacer la ligne du nom public par l'adresse IP 127.0.0.1 :
Étape 7
Nous enregistrons les modifications à l'aide de la combinaison de touches suivante :
Ctrl + O
Nous quittons l'éditeur en utilisant :
Ctrl + X
Étape 8
Nous procédons au redémarrage du service en exécutant ce qui suit :
systemctl redémarrer cassandraÉtape 9
Dans certains cas, il est recommandé de redémarrer l'ordinateur, de cette manière, nous corrigerons cette erreur.
Nous pouvons maintenant nous connecter au cluster Cassandra en exécutant la commande suivante :
cqlsh
Étape 10
Nous pouvons voir la connexion respective pour commencer à travailler sur cette base de données. Pour sortir, nous utiliserons le terme
sortirDe cette façon, nous avons vu comment installer et accéder à Cassandra dans CentOS 7.