Décrire les Données
pandas
offre la méthode pratique mean()
qui calcule la moyenne de toutes les valeurs pour chaque colonne.
df = pd.read_csv(file.csv)
mean_values = df.mean()
Vous pouvez également utiliser la même méthode pour déterminer la valeur moyenne d'une colonne spécifique :
df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()
pandas
fournit également la méthode mode()
, qui identifie la valeur la plus fréquente dans chaque colonne.
df = pd.read_csv(file.csv)
mode_values = df.mode()
Pour trouver la mode d'une colonne particulière, la même méthode est utilisée :
df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Une autre méthode utile dans pandas
est describe()
.
df = pd.read_csv(file.csv)
important_metrics = df.describe()
Cette méthode fournit un aperçu de divers indicateurs du jeu de données, y compris :
- Nombre total d'entrées ;
- Valeur moyenne ou moyenne ;
- Écart-type ;
- Les valeurs minimales et maximales ;
- Les 25e, 50e (médiane) et 75e percentiles.
Tâche
Swipe to start coding
- Calculez la moyenne de la colonne
'residual sugar'
. - Calculez la mode de la colonne
'fixed acidity'
. - Récupérez un aperçu de diverses statistiques de
wine_data
et stockez le résultat dansdescribed_data
.
Solution
Tout était clair ?
Merci pour vos commentaires !