Beskriva Data
pandas
erbjuder den praktiska metoden mean()
som beräknar medelvärdet av alla värden för varje kolumn.
df = pd.read_csv(file.csv)
mean_values = df.mean()
Du kan också använda samma metod för att bestämma medelvärdet för en specifik kolumn:
df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()
pandas
tillhandahåller också metoden mode()
, som identifierar det mest frekvent förekommande värdet i varje kolumn.
df = pd.read_csv(file.csv)
mode_values = df.mode()
För att hitta läget för en specifik kolumn används samma metod:
df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
En annan användbar metod i pandas
är describe()
.
df = pd.read_csv(file.csv)
important_metrics = df.describe()
Denna metod ger en översikt över olika mått från datasetet, inklusive:
- Totalt antal poster;
- Medelvärde eller genomsnittligt värde;
- Standardavvikelse;
- Minimi- och maximivärden;
- De 25:e, 50:e (median) och 75:e percentilerna.
Uppgift
Swipe to start coding
Du har fått en DataFrame
som heter wine_data
.
- Beräkna medelvärdet av kolumnen
'residual sugar'
och lagra resultatet i variabelnresidual_sugar_mean
. - Beräkna typvärdet av kolumnen
'fixed acidity'
och lagra resultatet i variabelnfixed_acidity_mode
. - Hämta en översikt över olika statistik från
wine_data
och lagra resultatet i variabelndescribed_data
.
Lösning
Var allt tydligt?
Tack för dina kommentarer!