Werken met Kolommen
Bij het werken met een DataFrame kun je elke kolom afzonderlijk benaderen.
df['column_name']
Ter verduidelijking van deze syntaxis:
- Begin met het schrijven van de naam van de DataFrame waarmee je werkt;
- Plaats vervolgens de kolomnaam die je wilt benaderen tussen rechte haken. Vergeet niet de kolomnaam tussen aanhalingstekens te plaatsen.
Als alternatief kun je puntnotatie gebruiken om een kolom te benaderen als de kolomnaam:
- Een geldige Python-identifier is (bijvoorbeeld geen spaties, speciale tekens of beginnend met een cijfer);
- Niet conflicteert met een bestaande
pandasattribuut- of methodenaam.
df.column_name
12345678910111213import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) capitals = countries['capital'] # Second option # capitals = countries.capital print(capitals)
Het uitvoeren van deze code toont alleen de kolom met hoofdsteden, in plaats van de volledige DataFrame.
Het is ook mogelijk om meerdere kolommen als volgt te benaderen:
df[['column1', 'column2', 'column3']]
In vergelijking met het benaderen van een enkele kolom is er slechts één verschil. Ditmaal moet de lijst met kolomnamen binnen een extra set vierkante haken worden geplaatst — dus er worden dubbele vierkante haken gebruikt.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) columns = countries[['country', 'capital']] print(columns)
Swipe to start coding
Je hebt een DataFrame met de naam audi_cars.
- Haal de gegevens op voor de kolommen
'model','year'en'price'en sla het resultaat op in de variabelecolumns.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Can I use dot notation to access multiple columns at once?
What happens if I try to access a column that doesn't exist?
Can you explain the difference between single and double square brackets when selecting columns?
Geweldig!
Completion tarief verbeterd naar 3.03
Werken met Kolommen
Veeg om het menu te tonen
Bij het werken met een DataFrame kun je elke kolom afzonderlijk benaderen.
df['column_name']
Ter verduidelijking van deze syntaxis:
- Begin met het schrijven van de naam van de DataFrame waarmee je werkt;
- Plaats vervolgens de kolomnaam die je wilt benaderen tussen rechte haken. Vergeet niet de kolomnaam tussen aanhalingstekens te plaatsen.
Als alternatief kun je puntnotatie gebruiken om een kolom te benaderen als de kolomnaam:
- Een geldige Python-identifier is (bijvoorbeeld geen spaties, speciale tekens of beginnend met een cijfer);
- Niet conflicteert met een bestaande
pandasattribuut- of methodenaam.
df.column_name
12345678910111213import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) capitals = countries['capital'] # Second option # capitals = countries.capital print(capitals)
Het uitvoeren van deze code toont alleen de kolom met hoofdsteden, in plaats van de volledige DataFrame.
Het is ook mogelijk om meerdere kolommen als volgt te benaderen:
df[['column1', 'column2', 'column3']]
In vergelijking met het benaderen van een enkele kolom is er slechts één verschil. Ditmaal moet de lijst met kolomnamen binnen een extra set vierkante haken worden geplaatst — dus er worden dubbele vierkante haken gebruikt.
12345678import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) columns = countries[['country', 'capital']] print(columns)
Swipe to start coding
Je hebt een DataFrame met de naam audi_cars.
- Haal de gegevens op voor de kolommen
'model','year'en'price'en sla het resultaat op in de variabelecolumns.
Oplossing
Bedankt voor je feedback!
single