Summary  
This chapter covers advanced data selection techniques, demonstrating how to extract multiple rows and columns in R using base indexing and dplyr’s select and slice functions with the pipe operator.  

General domain of usage  
Data manipulation

Vous savez déjà comment sélectionner des lignes et des colonnes individuelles à l'aide de l'indexation de base. Il est maintenant temps d'aller plus loin et d'explorer comment sélectionner plusieurs lignes et colonnes en utilisant à la fois le **R** de base et le package `dplyr`. Ces techniques sont essentielles lorsque vous souhaitez vous concentrer sur des parties spécifiques d'un jeu de données ou préparer vos données pour une analyse ultérieure.

### R de base
Il est possible de sélectionner plusieurs colonnes en combinant leurs positions ou leurs noms avec la fonction `c()`. Le résultat est un data frame réduit contenant uniquement les colonnes spécifiées.

Utilisation des positions de colonnes :
```
selected_data_base <- df[, c(1, 2, 3)]
```

Utilisation des noms de colonnes :
```
selected_data_base <- df[, c("name", "selling_price", "transmission")]
```


### dplyr
La fonction `select()` permet de sélectionner directement les noms de colonnes.

```
selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)
```

## Indexation de valeurs uniques
Pour accéder à une valeur spécifique, indiquer à la fois le numéro de ligne et de colonne. Utile pour vérifier ou déboguer des points de données individuels.

```
df[1, 2]  # accesses the value in row 1, column 2
```

## Découpage des lignes
Il est parfois nécessaire de travailler uniquement avec les premières lignes ou avec des lignes spécifiques selon leur position.

### Base R
Il est possible de sélectionner plusieurs lignes en spécifiant l’indice de la première et de la dernière ligne, séparés par un `:`.
```
first_5_rows_base <- df[1:5, ]
```

### dplyr
La fonction `slice()` permet de sélectionner une plage de lignes en lui passant les indices souhaités.
```
first_5_rows_dplyr <- df %>%
  slice(1:5)
```


Acquérir une expérience pratique de l'analyse de données avec R en apprenant à nettoyer, transformer et visualiser des ensembles de données. Explorer les flux de travail essentiels tels que la sélection et le filtrage des données, la gestion des valeurs manquantes et la synthèse des résultats. Développer la confiance dans la préparation des données pour l'extraction d'informations, la création de rapports et l'exploration statistique approfondie.

Explorez les bases de l'analyse de données avec R. Découvrez comment installer les outils, charger et inspecter des jeux de données, sélectionner et filtrer des informations, trier et transformer des données, gérer les valeurs manquantes et résumer les résultats pour obtenir des analyses approfondies.

Apprenez à créer des visualisations percutantes avec ggplot2. Construisez des diagrammes en barres, des histogrammes, des courbes de densité et des nuages de points, puis personnalisez-les et affinez-les à l’aide d’options de style et de facettage pour révéler des informations plus approfondies dans vos données.

Renforcez votre compréhension des statistiques pour l'analyse de données. Appliquez des mesures descriptives, identifiez et traitez les valeurs aberrantes, et utilisez des techniques de corrélation avec des outils visuels tels que les cartes de chaleur et les nuages de points pour révéler des relations significatives.

Sélection de Données - Techniques Avancées

Sélection de plusieurs colonnes

R de base

dplyr

Indexation de valeurs uniques

Découpage des lignes

Base R

dplyr