CSV-Dateien
Da pandas die Standardbibliothek für Datenanalyse und -manipulation ist, gehört zu seinen wichtigsten Funktionen die Fähigkeit, verschiedene Dateitypen zu lesen und zu schreiben, einschließlich CSV-Dateien.
Eine CSV (Comma-Separated Values)-Datei ist eine Textdatei zur Speicherung tabellarischer Daten, wobei jede Zeile einen Datensatz darstellt und die Spalten durch Kommas getrennt sind.
Eine CSV-Datei kann folgende Daten enthalten:
- Zahlen: Ganzzahlen oder Dezimalwerte (z. B.
42,3.14); - Text: Zeichenketten oder kategoriale Daten (z. B.
John,Active); - Datum/Uhrzeit: Zeitstempel (z. B.
2023-12-30); - Booleans: logische Werte (
True,False).
Jede Zeile muss die gleiche Anzahl an Spalten haben, und die erste Zeile enthält häufig die Spaltenüberschriften.
Funktionen wie read_csv() und to_csv() sind nützlich für die Arbeit mit CSV-Daten.
Die grundlegende Syntax von read_csv() und wichtige Parameter sind wie folgt:
Hier ist die aktualisierte Version mit dem index_col-Parameter, der klar erläutert wird:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)
filepath_or_buffer: Pfad zur CSV-Datei (String oder URL);sep: Trennzeichen (Standard ist ein Komma,);header: Zeilennummer, die als Spaltenüberschriften verwendet wird (Standard ist die erste Zeile);names: Liste der zu verwendenden Spaltennamen;usecols: Teilmenge der zu lesenden Spalten;index_col: Spalte (oder Liste von Spalten), die als DataFrame-Index gesetzt wird.
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Stellen Sie sicher, dass der Datensatz-Link in Anführungszeichen gesetzt ist.
Die grundlegende Syntax von to_csv() und die wichtigsten Parameter sind wie folgt:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: Dateipfad oder Objekt, in das die CSV-Datei geschrieben werden soll;sep: Trennzeichen zur Abgrenzung der Werte (Standard ist ein Komma,);columns: Teilmenge der zu schreibenden Spalten (Standard ist alle Spalten);header: Gibt an, ob die Spaltennamen als Kopfzeile eingefügt werden sollen (Standard istTrue);index: Gibt an, ob die Zeilenindizes in die Datei geschrieben werden sollen (Standard istTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Sie erhalten eine URL zu einer CSV-Datei, die als Zeichenkette in der Variablen file_url gespeichert ist.
- Lesen Sie die CSV-Datei von der angegebenen URL in ein
DataFramemit dem Namenwine_dataein.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Großartig!
Completion Rate verbessert auf 3.03
CSV-Dateien
Swipe um das Menü anzuzeigen
Da pandas die Standardbibliothek für Datenanalyse und -manipulation ist, gehört zu seinen wichtigsten Funktionen die Fähigkeit, verschiedene Dateitypen zu lesen und zu schreiben, einschließlich CSV-Dateien.
Eine CSV (Comma-Separated Values)-Datei ist eine Textdatei zur Speicherung tabellarischer Daten, wobei jede Zeile einen Datensatz darstellt und die Spalten durch Kommas getrennt sind.
Eine CSV-Datei kann folgende Daten enthalten:
- Zahlen: Ganzzahlen oder Dezimalwerte (z. B.
42,3.14); - Text: Zeichenketten oder kategoriale Daten (z. B.
John,Active); - Datum/Uhrzeit: Zeitstempel (z. B.
2023-12-30); - Booleans: logische Werte (
True,False).
Jede Zeile muss die gleiche Anzahl an Spalten haben, und die erste Zeile enthält häufig die Spaltenüberschriften.
Funktionen wie read_csv() und to_csv() sind nützlich für die Arbeit mit CSV-Daten.
Die grundlegende Syntax von read_csv() und wichtige Parameter sind wie folgt:
Hier ist die aktualisierte Version mit dem index_col-Parameter, der klar erläutert wird:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)
filepath_or_buffer: Pfad zur CSV-Datei (String oder URL);sep: Trennzeichen (Standard ist ein Komma,);header: Zeilennummer, die als Spaltenüberschriften verwendet wird (Standard ist die erste Zeile);names: Liste der zu verwendenden Spaltennamen;usecols: Teilmenge der zu lesenden Spalten;index_col: Spalte (oder Liste von Spalten), die als DataFrame-Index gesetzt wird.
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Stellen Sie sicher, dass der Datensatz-Link in Anführungszeichen gesetzt ist.
Die grundlegende Syntax von to_csv() und die wichtigsten Parameter sind wie folgt:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: Dateipfad oder Objekt, in das die CSV-Datei geschrieben werden soll;sep: Trennzeichen zur Abgrenzung der Werte (Standard ist ein Komma,);columns: Teilmenge der zu schreibenden Spalten (Standard ist alle Spalten);header: Gibt an, ob die Spaltennamen als Kopfzeile eingefügt werden sollen (Standard istTrue);index: Gibt an, ob die Zeilenindizes in die Datei geschrieben werden sollen (Standard istTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Sie erhalten eine URL zu einer CSV-Datei, die als Zeichenkette in der Variablen file_url gespeichert ist.
- Lesen Sie die CSV-Datei von der angegebenen URL in ein
DataFramemit dem Namenwine_dataein.
Lösung
Danke für Ihr Feedback!
single