Sum() en Count()
pandas
biedt de count()
methode, die alle niet-nul cellen telt (noch None
noch NaN
) voor elke kolom.
df = pd.read_csv(file.csv)
number_of_cells = df.count()
Om het aantal niet-nul waarden in een specifieke kolom te vinden, gebruik je de volgende syntaxis:
df = pd.read_csv(file.csv)
number_of_cells = df['name of the column'].count()
pandas
biedt ook de sum()
methode. Deze methode berekent de som van waarden voor elke kolom, maar werkt alleen met numerieke of booleaanse kolommen.
df = pd.read_csv(file.csv)
total = df.sum()
Aangezien de isna()
methode een booleaanse DataFrame retourneert, kun je de volgende syntaxis gebruiken om het aantal ontbrekende waarden voor elk van de kolommen te berekenen:
missing_values_count = df.isna().sum()
Om de som van waarden in een bepaalde kolom te vinden, gebruik je de volgende syntaxis:
df = pd.read_csv(file.csv)
total = df['name of the column'].sum()
Taak
Swipe to start coding
Je hebt een DataFrame
genaamd audi_cars
.
- Verkrijg het aantal niet-nul cellen in elke kolom en sla het resultaat op in de variabele
number_of_cells
. - Bereken de totale prijs (met behulp van de
'price'
kolom) voor alle auto's in deDataFrame
en sla het resultaat op in de variabeletotal_price
. - Identificeer het aantal ontbrekende waarden in elke kolom en sla het resultaat op in de variabele
null_count
.
Oplossing
Was alles duidelijk?
Bedankt voor je feedback!