Зміст курсу
Перші Кроки в Pandas
Перші Кроки в Pandas
Унікальні Значення
Дані часто дублюються у DataFrame. Наприклад, у нашому DataFrame countries
, в стовпці continent
дані повторювались. Існує функція, яка повертає масив унікальних значень з конкретного стовпця DataFrame. Давайте повернемося до цього DataFrame:
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) print(countries)
Тепер давайте застосуємо функцію unique()
до стовпців continent
та country
.
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
To count the number of distinct values in a specific column, you can use the nunique()
method:
Swipe to show code editor
Given the audi_cars
DataFrame:
- Identify all distinct values in the
'year'
and'fueltype'
columns.
Дякуємо за ваш відгук!
Унікальні Значення
Дані часто дублюються у DataFrame. Наприклад, у нашому DataFrame countries
, в стовпці continent
дані повторювались. Існує функція, яка повертає масив унікальних значень з конкретного стовпця DataFrame. Давайте повернемося до цього DataFrame:
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) print(countries)
Тепер давайте застосуємо функцію unique()
до стовпців continent
та country
.
import pandas as pd dataset = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(dataset) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
To count the number of distinct values in a specific column, you can use the nunique()
method:
Swipe to show code editor
Given the audi_cars
DataFrame:
- Identify all distinct values in the
'year'
and'fueltype'
columns.
Дякуємо за ваш відгук!