Sum() og Count()
pandas
tilbyder metoden count()
, som tæller alle ikke-null celler (hverken None
eller NaN
) for hver kolonne.
df = pd.read_csv(file.csv)
number_of_cells = df.count()
For at finde antallet af ikke-null værdier i en specifik kolonne, brug følgende syntaks:
df = pd.read_csv(file.csv)
number_of_cells = df['name of the column'].count()
pandas
tilbyder også metoden sum()
. Denne metode beregner summen af værdier for hver kolonne, men den fungerer kun med numeriske eller boolske kolonner.
df = pd.read_csv(file.csv)
total = df.sum()
Da metoden isna()
returnerer en boolsk DataFrame, kan du bruge følgende syntaks til at beregne antallet af manglende værdier for hver af kolonnerne:
missing_values_count = df.isna().sum()
For at finde summen af værdier i en bestemt kolonne, brug følgende syntaks:
df = pd.read_csv(file.csv)
total = df['name of the column'].sum()
Opgave
Swipe to start coding
Du har fået en DataFrame
ved navn audi_cars
.
- Få antallet af ikke-null celler i hver kolonne og gem resultatet i variablen
number_of_cells
. - Beregn den samlede pris (ved hjælp af
'price'
kolonnen) for alle biler iDataFrame
og gem resultatet i variablentotal_price
. - Identificer antallet af manglende værdier i hver kolonne og gem resultatet i variablen
null_count
.
Løsning
Var alt klart?
Tak for dine kommentarer!