Encontrando os Menores Valores de uma Coluna
Você aprenderá outra função crucial, que retorna os maiores ou menores valores. Já se sabe que é possível ordenar valores e então extrair um número específico de linhas. Não surpreendentemente, o pandas permite fazer isso utilizando apenas uma linha de código. Veja o exemplo de como recuperar os quinze carros mais antigos:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
Para ordenar por uma coluna e depois por outra, basta inserir uma lista com os nomes das colunas na ordem desejada. Veja o exemplo em que a ordenação será feita primeiro por 'Year' e depois por 'Engine_volume'. Este código irá extrair os 5 carros mais antigos e, caso os anos coincidam, o carro com o menor valor na coluna 'Engine_volume' terá prioridade:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
Tente comparar os dois exemplos abaixo. Agora vamos avançar um pouco mais na função. Vamos retornar nossos exemplos com os valores da coluna 'Year'. Em nossa coluna, os valores de 'Year' podem se repetir, então, se quisermos exibir os dez carros mais antigos com a sintaxe anterior, nossa função irá considerar apenas dez valores. Não importa se o 11º ou 12º valor é igual ao 10º. Podemos adicionar o argumento keep = 'all' ao método .nsmallest() para evitar esses casos. Observe o exemplo e tente executá-lo para ver a diferença:
1234567891011import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
Swipe to start coding
Aqui, siga este algoritmo:
- Recupere dados dos carros em que os valores da coluna
'Year'sejam maiores que2010. - Extraia os
15carros mais baratos (os15menores valores da coluna'Price'). Inclua todos os valores duplicados da coluna'Price'. - Exiba todos os valores do conjunto de dados
data_cheapest.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 3.03
Encontrando os Menores Valores de uma Coluna
Deslize para mostrar o menu
Você aprenderá outra função crucial, que retorna os maiores ou menores valores. Já se sabe que é possível ordenar valores e então extrair um número específico de linhas. Não surpreendentemente, o pandas permite fazer isso utilizando apenas uma linha de código. Veja o exemplo de como recuperar os quinze carros mais antigos:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
Para ordenar por uma coluna e depois por outra, basta inserir uma lista com os nomes das colunas na ordem desejada. Veja o exemplo em que a ordenação será feita primeiro por 'Year' e depois por 'Engine_volume'. Este código irá extrair os 5 carros mais antigos e, caso os anos coincidam, o carro com o menor valor na coluna 'Engine_volume' terá prioridade:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
Tente comparar os dois exemplos abaixo. Agora vamos avançar um pouco mais na função. Vamos retornar nossos exemplos com os valores da coluna 'Year'. Em nossa coluna, os valores de 'Year' podem se repetir, então, se quisermos exibir os dez carros mais antigos com a sintaxe anterior, nossa função irá considerar apenas dez valores. Não importa se o 11º ou 12º valor é igual ao 10º. Podemos adicionar o argumento keep = 'all' ao método .nsmallest() para evitar esses casos. Observe o exemplo e tente executá-lo para ver a diferença:
1234567891011import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
Swipe to start coding
Aqui, siga este algoritmo:
- Recupere dados dos carros em que os valores da coluna
'Year'sejam maiores que2010. - Extraia os
15carros mais baratos (os15menores valores da coluna'Price'). Inclua todos os valores duplicados da coluna'Price'. - Exiba todos os valores do conjunto de dados
data_cheapest.
Solução
Obrigado pelo seu feedback!
single