Kursinhalt
Pandas Erste Schritte
Pandas Erste Schritte
Hinzufügen Einer Neuen Spalte
Wir haben gelernt, wie man ein DataFrame
erstellt. Jetzt wollen wir erkunden, was wir damit machen können. Zuerst erstellen wir ein kompaktes DataFrame
, das aus 3 Spalten und 7 Zeilen besteht.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Sie können das DataFrame erweitern, indem Sie neue Spalten hinzufügen, und die gebräuchlichste Methode, dies zu tun, ist wie folgt:
-
dataframe
ist der Name unseres bestehenden DataFrames, dem wir neue Spalten hinzufügen; -
name_of_new_column
ist der Name, den Sie der neuen Spalte geben, die Sie hinzufügen; -
value_1, value_2, value_3
sind die Werte, die die neue Spalte füllen werden.
Hinweis
Der Name der neuen Spalte sollte in Anführungszeichen gesetzt und in eckige Klammern eingeschlossen werden, wie
['NewColumnName']
. Die Werte, die der neuen Spalte zugewiesen werden, sollten ebenfalls in eckigen Klammern stehen, zum Beispieldata['NewColumnName'] = [value1, value2, value3]
. Wenn die Werte numerisch sind, können sie ohne Anführungszeichen geschrieben werden, wie[1, 2, 3]
. Wenn die Werte Zeichenfolgen sind, sollte jeder in Anführungszeichen gesetzt werden, wie['A', 'B', 'C']
.
Jetzt fügen wir eine 'population'
-Spalte zu unserem bereits bestehenden countries
DataFrame hinzu.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Sie können auch die Punktnotation (z.B. df.column
) verwenden, um auf bestehende Spalten zuzugreifen, aber sie kann nicht verwendet werden, um neue Spalten zu erstellen. Verwenden Sie hierfür immer eckige Klammern (z.B. df['column']
).
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Wie erwartet wurde die 'population'
-Spalte nicht erstellt, da Pandas nicht erlaubt, Spalten auf diese Weise zu erstellen.
Danke für Ihr Feedback!