Introduction à la programmation statistique avec R

Table des matières
R est un langage de programmation statistique, il est gratuit et open source. Il est principalement utilisé pour les opérations de exploration de données ou statistiques, tout cela dans le but de créer des applications pour l'analyse de grandes quantités de données.
L'interface de ligne de commande de R Au début, cela peut être quelque peu intimidant, mais cela est éclipsé après avoir apprécié le pouvoir et les possibilités que le langage nous offre pour partager et reproduire l'analyse de l'information.
R Il peut être téléchargé gratuitement pour toutes les plateformes gratuites qui existent aujourd'hui, nous avons la possibilité de l'installer dans les fenêtres, Linux et même Mac.
Pour les besoins de ce tutoriel, nous utiliserons la version pour les fenêtres que nous pouvons trouver sur la page officielle du projet dans le lien suivant. Après le téléchargement et l'installation, nous aurons notre copie fonctionnelle de R, si nous l'exécutons, nous aurons l'écran initial de R qui devrait ressembler à ceci :

R Il nous permet de travailler avec des données de manière rapide et efficace, mais son interface par défaut n'est pas parfaite pour cette tâche. L'un des problèmes est que tout s'ouvre dans des fenêtres séparées, ce qui rend le travail difficile et que l'interface de ligne de commande n'est pas la même dans tous les systèmes d'exploitation.
Bien qu'il existe de nombreuses interfaces pour résoudre ce problème, dans ce tutoriel, nous utiliserons RStudio qui est disponible pour toutes les plateformes, mais il est important de mentionner qu'il est nécessaire d'avoir R installé avant l'installation, pour obtenir la version de les fenêtres nous allons au lien suivant et téléchargeons la version correspondante.
Après l'installation, nous exécutons RStudio et nous devrions voir l'interface principale :

RStudio nous donne l'organisation de toutes les fenêtres de R au sein d'un seul panneau et nous donne en plus accès à des fonctions qui peuvent être difficiles à trouver, en plus de cela nous pouvons mentionner d'autres avantages supplémentaires :
  • Divisons notre travail en Projets où chacun d'eux aura son répertoire de travail, son historique et ses fichiers source.
  • Intégration avec GitHub.
  • Vous permet de stocker une histoire graphiquement.
  • Vous pouvez exporter les graphiques dans différents formats et tailles.
  • Il nous permet de compléter le code avec la clé tabulaire.
  • Vous pouvez créer des graphiques interactifs grâce à certains packages.
Comme on le voit RStudio est une façon assez optimale de travailler avec RCependant, il existe d'autres solutions sur le marché, il appartient à chacun d'étudier celles-ci et d'évaluer si elles sont mieux adaptées aux besoins de chacun.
Il existe plusieurs façons de travailler avec R où la première chose que nous aborderons est la console RMalgré le fait que nous ne puissions pas stocker le travail effectué ici, il est assez utile de tester certaines fonctions et de commencer à se familiariser avec le langage.
Travailler avec la console est assez simple, nous entrons une commande puis R nous en donne la sortie, essayons une opération d'addition simple comme la suivante :
> 10 + 7

Nous poussons Entrer et automatiquement R Dans la ligne suivante il nous donne la réponse à notre opération :

Comme nous pouvons le voir dans l'image la première ligne contient la commande avec notre opération, il est important de mentionner que R il ne nécessite pas d'utiliser le point-virgule pour terminer la ligne ou tout autre opérateur de terminaison. On peut voir dans la deuxième ligne avant la réponse le [1] cela indique la manière dont R effectue des opérations arithmétiques et utilise vecteur, le premier désigne l'index du premier élément du vecteur, où l'on peut souligner que de nombreux autres langages gèrent les index à partir de zéro mais R le fait de l'un.
Comme nous l'avons mentionné précédemment, la console est assez utile mais ce n'est pas la meilleure pour travailler, principalement parce qu'elle n'a pas la possibilité de stocker nos commandes et la possibilité de n'entrer qu'une commande à la fois, quelque chose de similaire se produit avec Python, mais il ne faut pas s'inquiéter car RStudio nous donne le fenêtre de script situé dans la partie supérieure de notre console, si nous ne le trouvons pas, nous allons à Fichier> Nouveau fichier> Script R ou appuyez sur Maj + Commande + N.
Fondamentalement, un script R est du texte brut avec l'extension .R. Pour voir comment cela fonctionne, nous pouvons recréer notre opération arithmétique à partir de l'exemple précédent en créant un nouveau script et en ajoutant plusieurs lignes de commande supplémentaires, voyons :
 10 + 7 1:50 impression ("Hello World") 

UNE Script R vous pouvez exécuter ligne par ligne avec l'option que nous avons dans le menu supérieur appelé Cours et nous verrons la sortie de la même chose dans la console, voyons la réponse pour chaque ligne de notre script :

Comment pouvons-nous voir que la première ligne nous donne le résultat que nous avons obtenu précédemment, la deuxième ligne crée une liste de nombres de 1 à 50 où le nombre entre parenthèses est le premier indice de cette ligne et enfin nous avons l'impression du classique Salut monde.
Après avoir vu les manières dont nous pouvons travailler avec le langage, nous passerons à des concepts plus théoriques afin de mieux comprendre ce dont nous disposons en langage pour travailler et exécuter nos projets.
Comme dans tous les langages de programmation, variables sont l'un des aspects les plus importants, pour les créer dans R Il suffit d'écrire le nom de celui-ci sans en définir le type. Nous utilisons le opérateur d'assignation pour donner la valeur à la variable.
ImportantNous pouvons attribuer la valeur d'une variable avec le signe égal mais c'est une mauvaise pratique dans R, pour effectuer l'affectation correcte, utilisez l'opérateur <-.
Voyons à quoi ressemble l'attribution d'une valeur à une variable puis son impression :
 x <- 58 x 

On peut aussi affecter plusieurs valeurs à nos variables avec la fonction concaténer :
y <-c (5, 2, 11, 28, 17)

Si nous exécutons l'exemple, nous verrons dans le panneau de droite comment nous avons la valeur de X et la liste numérique attribuée à Oui:

AGRANDIR

De plus, pour éliminer une variable de l'espace de travail, il suffit d'utiliser la fonction rm, nous pouvons même nettoyer tout l'espace de travail, voyons comment procéder :
 rm (x) rm (liste = ls ()) 

Avec la première ligne nous éliminons la variable et avec la deuxième ligne tout l'espace.
Dans le langage, nous avons quatre structures de données, qui sont reconnues par R:
Vecteur de dessin animéUn vecteur est un tableau à une dimension dans lequel toutes les données présentes doivent être du même type, entier, caractère, etc. De plus, il est important de noter qu'il s'agit de l'objet de données de base dans R.
Tableaux et matricesUne matrice est similaire à un vecteur où les données doivent être du même type, cependant la matrice a deux dimensions et les informations sont organisées en lignes et en colonnes. Le tableau est similaire au tableau mais il peut avoir plus de deux dimensions.
Trames de donnéesLes trames de données sont un ensemble de vecteurs de même longueur, c'est similaire à la matrice mais la particularité de ce type de structure est qu'elles peuvent être de types de données mixtes, où les vecteurs peuvent même avoir des noms.
ListesLe type de structure le plus générique dans R, une liste est une collection d'éléments de n'importe quelle classe, longueur ou structure, nous pouvons même avoir d'autres listes.
Davantage, R Il a plusieurs fonctions qui nous permettent de convertir un type de structure en un autre, voyons :
comme.vecteur ()Cette fonction vous permet de convertir des matrices en vecteurs unidimensionnels.
comme.matrice ()Vous pouvez convertir des structures de données en tableau.
as.data.frame ()Vous pouvez convertir des structures de données en blocs de données.
comme.list ()Vous pouvez convertir des structures de données en listes.
L'un des points forts de R est que vous pouvez ajouter des packages qui nous permettent d'étendre les fonctionnalités du langage. Dans d'autres langages ces plugins viennent dans des bibliothèques mais dans R la bibliothèque est l'endroit où tous les packages sont stockés.
Les paquets de R peuvent provenir de deux endroits différents, certains viennent avec R par défaut mais ils ne sont pas actifs et d'autres peuvent être trouvés dans les référentiels en ligne.
Pour voir les packages actuellement installés ou chargés, nous pouvons exécuter les fonctions suivantes :
 bibliothèque () recherche () 

La fonction une bibliothèque () nous apporte une liste des packages actuellement installés, voyons une partie de ce qu'il nous renvoie lorsque nous exécutons cette ligne :

La fonction chercher () Par contre, il nous montre par console les packages qui sont actuellement chargés, voyons dans l'image suivante quels packages nous avons chargés :

De plus, pour installer des packages, nous pouvons le faire de plusieurs manières, la première consiste à utiliser l'option dans le menu du haut Outils> Installer des packages et puis nous avons des fonctions du langage via, ce dernier est celui que nous recommandons puisqu'il peut ainsi faire partie de notre script.
Pour installer un paquet que nous utilisons install.paquets, après cela, nous devons l'inclure, nous pouvons utiliser une bibliothèque ou alors exiger Pour cela, cependant, il est préférable d'utiliser ce dernier pour éviter toute confusion avec la portée des fonctions, voyons comment nous installons et incluons le package ggplot2:
 install.packages ("ggplot2") requiert ("ggplot2") 

Enfin pour supprimer un paquet que nous pouvons utiliser supprimer.les.paquets, voyons comment il est utilisé :
remove.packages ("ggplot2")

Avec cela, nous terminons ce tutoriel, avec lequel nous avons déjà une idée de la façon de travailler avec R, en plus d'avoir clarifié des points tels que les variables et les structures de données, aspects essentiels que nous devons connaître afin de profiter pleinement de ce langage puissant et efficace.Avez-vous aimé et aidé ce tutoriel ?Vous pouvez récompenser l'auteur en appuyant sur ce bouton pour lui donner un point positif

Vous contribuerez au développement du site, partager la page avec vos amis

wave wave wave wave wave