Contenido del Curso
Primeros Pasos con Pandas
Primeros Pasos con Pandas
Valores Únicos
A menudo, los datos se duplican en los DataFrames. Por ejemplo, en nuestro DataFrame countries
, la columna continent
tiene entradas repetidas. Existe una función que recupera una matriz de valores distintos de una columna específica del DataFrame. Volvamos a este DataFrame.
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) print(countries)
Ahora, apliquemos la función unique()
a las columnas continent
y country
.
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Tarea
Dado el DataFrame audi_cars
, por favor identifique todos los valores distintos en las columnas year
y fueltype
.
¡Gracias por tus comentarios!
Valores Únicos
A menudo, los datos se duplican en los DataFrames. Por ejemplo, en nuestro DataFrame countries
, la columna continent
tiene entradas repetidas. Existe una función que recupera una matriz de valores distintos de una columna específica del DataFrame. Volvamos a este DataFrame.
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) print(countries)
Ahora, apliquemos la función unique()
a las columnas continent
y country
.
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Tarea
Dado el DataFrame audi_cars
, por favor identifique todos los valores distintos en las columnas year
y fueltype
.
¡Gracias por tus comentarios!
Valores Únicos
A menudo, los datos se duplican en los DataFrames. Por ejemplo, en nuestro DataFrame countries
, la columna continent
tiene entradas repetidas. Existe una función que recupera una matriz de valores distintos de una columna específica del DataFrame. Volvamos a este DataFrame.
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) print(countries)
Ahora, apliquemos la función unique()
a las columnas continent
y country
.
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Tarea
Dado el DataFrame audi_cars
, por favor identifique todos los valores distintos en las columnas year
y fueltype
.
¡Gracias por tus comentarios!
A menudo, los datos se duplican en los DataFrames. Por ejemplo, en nuestro DataFrame countries
, la columna continent
tiene entradas repetidas. Existe una función que recupera una matriz de valores distintos de una columna específica del DataFrame. Volvamos a este DataFrame.
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) print(countries)
Ahora, apliquemos la función unique()
a las columnas continent
y country
.
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Tarea
Dado el DataFrame audi_cars
, por favor identifique todos los valores distintos en las columnas year
y fueltype
.