Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Fichiers CSV | Lecture de Fichiers dans Pandas
Practice
Projects
Quizzes & Challenges
Quizzes
Challenges
/
Introduction à Pandas

bookFichiers CSV

Puisque pandas est la bibliothèque de référence pour l’analyse et la manipulation de données, l’une de ses principales fonctionnalités est sa capacité à lire et écrire différents types de fichiers, y compris les fichiers CSV.

Un fichier CSV (Comma-Separated Values) est un fichier texte brut utilisé pour stocker des données tabulaires, où chaque ligne représente un enregistrement et les colonnes sont séparées par des virgules.

Un fichier CSV peut contenir les données suivantes :

  • Nombres : valeurs entières ou décimales (par exemple, 42, 3.14) ;
  • Texte : chaînes de caractères ou données catégorielles (par exemple, John, Active) ;
  • Dates/Heures : horodatages (par exemple, 2023-12-30) ;
  • Booléens : valeurs logiques (True, False).

Chaque ligne doit comporter le même nombre de colonnes, et la première ligne contient souvent les en-têtes de colonnes.

Des fonctions telles que read_csv() et to_csv() sont utiles pour traiter les données CSV.

La syntaxe de base de read_csv() et ses paramètres principaux sont les suivants :

Voici la version mise à jour avec le paramètre index_col ajouté et expliqué clairement :


pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)
  • filepath_or_buffer : chemin vers le fichier CSV (chaîne de caractères ou URL) ;
  • sep : délimiteur (par défaut une virgule ,) ;
  • header : numéro de la ligne à utiliser comme en-têtes de colonnes (par défaut la première ligne) ;
  • names : liste des noms de colonnes à utiliser ;
  • usecols : sous-ensemble de colonnes à lire ;
  • index_col : colonne (ou liste de colonnes) à définir comme index du DataFrame.
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy
Note
Remarque

S’assurer que le lien du jeu de données est entouré de guillemets.

La syntaxe de base de to_csv() et les paramètres clés sont les suivants :

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
  • path_or_buf : chemin du fichier ou objet où le CSV doit être écrit ;
  • sep : délimiteur pour séparer les valeurs (par défaut une virgule ,) ;
  • columns : sous-ensemble de colonnes à écrire (par défaut toutes les colonnes) ;
  • header : inclusion ou non des noms de colonnes comme en-tête (par défaut True) ;
  • index : inclusion ou non des indices de lignes dans le fichier (par défaut True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Tâche

Swipe to start coding

Vous disposez d'une URL vers un fichier CSV stocké sous forme de chaîne de caractères dans la variable file_url.

  • Lire le fichier CSV à partir de l'URL donnée dans un DataFrame nommé wine_data.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 1
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

What does the `index_col` parameter do in `read_csv()`?

Can you explain the difference between `header` and `names` in `read_csv()`?

How can I read only specific columns from a CSV file using pandas?

close

bookFichiers CSV

Glissez pour afficher le menu

Puisque pandas est la bibliothèque de référence pour l’analyse et la manipulation de données, l’une de ses principales fonctionnalités est sa capacité à lire et écrire différents types de fichiers, y compris les fichiers CSV.

Un fichier CSV (Comma-Separated Values) est un fichier texte brut utilisé pour stocker des données tabulaires, où chaque ligne représente un enregistrement et les colonnes sont séparées par des virgules.

Un fichier CSV peut contenir les données suivantes :

  • Nombres : valeurs entières ou décimales (par exemple, 42, 3.14) ;
  • Texte : chaînes de caractères ou données catégorielles (par exemple, John, Active) ;
  • Dates/Heures : horodatages (par exemple, 2023-12-30) ;
  • Booléens : valeurs logiques (True, False).

Chaque ligne doit comporter le même nombre de colonnes, et la première ligne contient souvent les en-têtes de colonnes.

Des fonctions telles que read_csv() et to_csv() sont utiles pour traiter les données CSV.

La syntaxe de base de read_csv() et ses paramètres principaux sont les suivants :

Voici la version mise à jour avec le paramètre index_col ajouté et expliqué clairement :


pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)
  • filepath_or_buffer : chemin vers le fichier CSV (chaîne de caractères ou URL) ;
  • sep : délimiteur (par défaut une virgule ,) ;
  • header : numéro de la ligne à utiliser comme en-têtes de colonnes (par défaut la première ligne) ;
  • names : liste des noms de colonnes à utiliser ;
  • usecols : sous-ensemble de colonnes à lire ;
  • index_col : colonne (ou liste de colonnes) à définir comme index du DataFrame.
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy
Note
Remarque

S’assurer que le lien du jeu de données est entouré de guillemets.

La syntaxe de base de to_csv() et les paramètres clés sont les suivants :

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
  • path_or_buf : chemin du fichier ou objet où le CSV doit être écrit ;
  • sep : délimiteur pour séparer les valeurs (par défaut une virgule ,) ;
  • columns : sous-ensemble de colonnes à écrire (par défaut toutes les colonnes) ;
  • header : inclusion ou non des noms de colonnes comme en-tête (par défaut True) ;
  • index : inclusion ou non des indices de lignes dans le fichier (par défaut True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Tâche

Swipe to start coding

Vous disposez d'une URL vers un fichier CSV stocké sous forme de chaîne de caractères dans la variable file_url.

  • Lire le fichier CSV à partir de l'URL donnée dans un DataFrame nommé wine_data.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 1
single

single

some-alt