Valori Unici
I dati vengono spesso duplicati nei DataFrame. Ad esempio, nel DataFrame countries, la colonna 'continent' presenta voci ripetute. Esiste un metodo che restituisce un array di valori distinti da una specifica colonna di un DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Successivamente, applicare il metodo unique() alle colonne 'continent' e 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Per contare il numero di valori distinti in una colonna specifica, è possibile utilizzare il metodo nunique():
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Ti viene fornito un DataFrame chiamato audi_cars.
- Identificare tutti i valori distinti nella colonna
'year'e memorizzare il risultato nella colonnaunique_years. - Identificare tutti i valori distinti nella colonna
'fueltype'e memorizzare il risultato nella variabileunique_fueltype. - Determinare il numero di tipi di carburante unici e memorizzare il risultato nella variabile
count_unique_fueltypes.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 3.03
Valori Unici
Scorri per mostrare il menu
I dati vengono spesso duplicati nei DataFrame. Ad esempio, nel DataFrame countries, la colonna 'continent' presenta voci ripetute. Esiste un metodo che restituisce un array di valori distinti da una specifica colonna di un DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Successivamente, applicare il metodo unique() alle colonne 'continent' e 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Per contare il numero di valori distinti in una colonna specifica, è possibile utilizzare il metodo nunique():
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Ti viene fornito un DataFrame chiamato audi_cars.
- Identificare tutti i valori distinti nella colonna
'year'e memorizzare il risultato nella colonnaunique_years. - Identificare tutti i valori distinti nella colonna
'fueltype'e memorizzare il risultato nella variabileunique_fueltype. - Determinare il numero di tipi di carburante unici e memorizzare il risultato nella variabile
count_unique_fueltypes.
Soluzione
Grazie per i tuoi commenti!
single