Unikke Værdier
Data bliver ofte duplikeret i DataFrames. For eksempel har kolonnen countries
i DataFrame'en 'continent'
gentagne værdier. Der findes en metode, der henter et array af unikke værdier fra en bestemt DataFrame-kolonne.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Anvend derefter metoden unique()
på kolonnerne 'continent'
og 'country'
:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
For at tælle antallet af unikke værdier i en bestemt kolonne, kan du bruge metoden nunique()
:
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Du har fået en DataFrame
ved navn audi_cars
.
- Identificér alle unikke værdier i kolonnen
'year'
og gem resultatet i kolonnenunique_years
. - Identificér alle unikke værdier i kolonnen
'fueltype'
og gem resultatet i variablenunique_fueltype
. - Bestem antallet af unikke brændstoftyper og gem resultatet i variablen
count_unique_fueltypes
.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 3.03
Unikke Værdier
Stryg for at vise menuen
Data bliver ofte duplikeret i DataFrames. For eksempel har kolonnen countries
i DataFrame'en 'continent'
gentagne værdier. Der findes en metode, der henter et array af unikke værdier fra en bestemt DataFrame-kolonne.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Anvend derefter metoden unique()
på kolonnerne 'continent'
og 'country'
:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
For at tælle antallet af unikke værdier i en bestemt kolonne, kan du bruge metoden nunique()
:
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Du har fået en DataFrame
ved navn audi_cars
.
- Identificér alle unikke værdier i kolonnen
'year'
og gem resultatet i kolonnenunique_years
. - Identificér alle unikke værdier i kolonnen
'fueltype'
og gem resultatet i variablenunique_fueltype
. - Bestem antallet af unikke brændstoftyper og gem resultatet i variablen
count_unique_fueltypes
.
Løsning
Tak for dine kommentarer!
single