Unika Värden
Data dupliceras ofta i DataFrames. Till exempel har kolumnen countries
i DataFrame:en 'continent'
upprepade värden. Det finns en metod som hämtar en array med unika värden från en specifik kolumn i en DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Applicera sedan metoden unique()
på kolumnerna 'continent'
och 'country'
:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
För att räkna antalet unika värden i en specifik kolumn används metoden nunique()
:
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Du har fått en DataFrame
som heter audi_cars
.
- Identifiera alla unika värden i kolumnen
'year'
och spara resultatet i kolumnenunique_years
. - Identifiera alla unika värden i kolumnen
'fueltype'
och spara resultatet i variabelnunique_fueltype
. - Fastställ antalet unika bränsletyper och spara resultatet i variabeln
count_unique_fueltypes
.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 3.03
Unika Värden
Svep för att visa menyn
Data dupliceras ofta i DataFrames. Till exempel har kolumnen countries
i DataFrame:en 'continent'
upprepade värden. Det finns en metod som hämtar en array med unika värden från en specifik kolumn i en DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Applicera sedan metoden unique()
på kolumnerna 'continent'
och 'country'
:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
För att räkna antalet unika värden i en specifik kolumn används metoden nunique()
:
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Du har fått en DataFrame
som heter audi_cars
.
- Identifiera alla unika värden i kolumnen
'year'
och spara resultatet i kolumnenunique_years
. - Identifiera alla unika värden i kolumnen
'fueltype'
och spara resultatet i variabelnunique_fueltype
. - Fastställ antalet unika bränsletyper och spara resultatet i variabeln
count_unique_fueltypes
.
Lösning
Tack för dina kommentarer!
single