Contenido del Curso
Primeros Pasos con Pandas
Primeros Pasos con Pandas
Valores Únicos
A menudo, los datos se duplican en los DataFrames. Por ejemplo, en nuestro DataFrame countries
, la columna continent
tiene entradas repetidas. Existe una función que recupera una matriz de valores distintos de una columna específica del DataFrame. Volvamos a este DataFrame.
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) print(countries)
Ahora, apliquemos la función unique()
a las columnas continent
y country
.
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
To count the number of distinct values in a specific column, you can use the nunique()
method:
Swipe to show code editor
Given the audi_cars
DataFrame:
- Identify all distinct values in the
'year'
and'fueltype'
columns.
¡Gracias por tus comentarios!
Valores Únicos
A menudo, los datos se duplican en los DataFrames. Por ejemplo, en nuestro DataFrame countries
, la columna continent
tiene entradas repetidas. Existe una función que recupera una matriz de valores distintos de una columna específica del DataFrame. Volvamos a este DataFrame.
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) print(countries)
Ahora, apliquemos la función unique()
a las columnas continent
y country
.
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
To count the number of distinct values in a specific column, you can use the nunique()
method:
Swipe to show code editor
Given the audi_cars
DataFrame:
- Identify all distinct values in the
'year'
and'fueltype'
columns.
¡Gracias por tus comentarios!