Valeurs Uniques
Les données sont souvent dupliquées dans les DataFrames. Par exemple, dans le DataFrame countries, la colonne 'continent' contient des entrées répétées. Il existe une méthode permettant d'obtenir un tableau de valeurs distinctes à partir d'une colonne spécifique d'un DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Ensuite, appliquez la méthode unique() aux colonnes 'continent' et 'country' :
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Pour compter le nombre de valeurs distinctes dans une colonne spécifique, utiliser la méthode nunique() :
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Vous disposez d'un DataFrame nommé audi_cars.
- Identifier toutes les valeurs distinctes dans la colonne
'year'et stocker le résultat dans la colonneunique_years. - Identifier toutes les valeurs distinctes dans la colonne
'fueltype'et stocker le résultat dans la variableunique_fueltype. - Déterminer le nombre de types de carburant uniques et stocker le résultat dans la variable
count_unique_fueltypes.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
How does the nunique() method work?
Can I use nunique() on multiple columns at once?
What is the difference between unique() and nunique()?
Awesome!
Completion rate improved to 3.03
Valeurs Uniques
Glissez pour afficher le menu
Les données sont souvent dupliquées dans les DataFrames. Par exemple, dans le DataFrame countries, la colonne 'continent' contient des entrées répétées. Il existe une méthode permettant d'obtenir un tableau de valeurs distinctes à partir d'une colonne spécifique d'un DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Ensuite, appliquez la méthode unique() aux colonnes 'continent' et 'country' :
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Pour compter le nombre de valeurs distinctes dans une colonne spécifique, utiliser la méthode nunique() :
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Vous disposez d'un DataFrame nommé audi_cars.
- Identifier toutes les valeurs distinctes dans la colonne
'year'et stocker le résultat dans la colonneunique_years. - Identifier toutes les valeurs distinctes dans la colonne
'fueltype'et stocker le résultat dans la variableunique_fueltype. - Déterminer le nombre de types de carburant uniques et stocker le résultat dans la variable
count_unique_fueltypes.
Solution
Merci pour vos commentaires !
single