Aprende Encontrar los Valores Más Pequeños de una Columna

Aprenderá otra función crucial, que devuelve los valores más pequeños o más grandes. Ya sabe que podemos ordenar los valores y luego extraer un número específico de filas. Como era de esperar, pandas puede hacerlo utilizando solo una línea de código. Observe el ejemplo de cómo recuperar los quince autos más antiguos:


              1234
            
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
data_smallest = data.nsmallest(15, 'Year')
print(data_smallest.head(15))

Si desea ordenar por una columna y luego por otra, simplemente coloque una lista con los nombres de las columnas en el orden necesario. Observe el ejemplo donde primero ordenaremos por 'Year' y luego por 'Engine_volume'. Este código primero extraerá los 5 autos más antiguos y, si los años coinciden, el auto con el valor menor en la columna 'Engine_volume' tendrá prioridad:


              1234
            
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
data_smallest = data.nsmallest(5, ['Year', 'Engine_volume'])
print(data_smallest.head())

Intente comparar los dos ejemplos a continuación. Ahora avanzaremos un poco más con la función. Devolvamos nuestros ejemplos con los valores de la columna 'Year'. En nuestra columna, los valores de 'Year' pueden repetirse, por lo que si queremos mostrar los diez autos más antiguos con la sintaxis anterior, nuestra función tomará solo diez valores. No considera si el valor 11 o 12 es igual al décimo. Podemos agregar el argumento keep = 'all' en el método .nsmallest() para evitar estos casos. Observe el ejemplo e intente ejecutarlo para ver la diferencia:


              1234567891011
            
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
# Case without using `keep = 'all'` argument
data_smallest = data.nsmallest(6, 'Year')
print(data_smallest)

data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
# Case with using `keep = 'all'` argument
data_smallest = data.nsmallest(6, 'Year',
                             keep = 'all')
print(data_smallest)

Tarea

Swipe to start coding

Aquí, se debe seguir el siguiente algoritmo:

Recuperar los datos de los autos donde los valores de la columna 'Year' sean mayores que 2010.
Extraer los 15 autos más económicos (los 15 valores más bajos de la columna 'Price'). Incluir todos los valores duplicados de la columna 'Price'.
Mostrar todos los valores del conjunto de datos data_cheapest.

Solución

¿Todo estuvo claro?

¡Gracias por tus comentarios!

Sección 3. Capítulo 5

single

Pregunte a AI

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Suggested prompts:

Can you explain what the `keep='all'` argument does in more detail?

How does `.nsmallest()` differ from sorting and slicing the DataFrame?

Can I use `.nlargest()` in a similar way to get the newest cars?

Desliza para mostrar el menú


              1234
            
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
data_smallest = data.nsmallest(15, 'Year')
print(data_smallest.head(15))


              1234
            
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
data_smallest = data.nsmallest(5, ['Year', 'Engine_volume'])
print(data_smallest.head())


              1234567891011
            
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
# Case without using `keep = 'all'` argument
data_smallest = data.nsmallest(6, 'Year')
print(data_smallest)

data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
# Case with using `keep = 'all'` argument
data_smallest = data.nsmallest(6, 'Year',
                             keep = 'all')
print(data_smallest)