Kuvaillaan Tietoja
pandas
tarjoaa kätevän mean()
-menetelmän, joka laskee keskiarvon kaikille arvoille kussakin sarakkeessa.
df = pd.read_csv(file.csv)
mean_values = df.mean()
Voit käyttää samaa menetelmää myös määrittääksesi keskiarvon tietylle sarakkeelle:
df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()
pandas
tarjoaa myös mode()
-menetelmän, joka tunnistaa useimmin esiintyvän arvon kussakin sarakkeessa.
df = pd.read_csv(file.csv)
mode_values = df.mode()
Löytääksesi moodin tietylle sarakkeelle, käytetään samaa menetelmää:
df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Toinen hyödyllinen menetelmä pandas
-kirjastossa on describe()
.
df = pd.read_csv(file.csv)
important_metrics = df.describe()
Tämä menetelmä tarjoaa yleiskatsauksen eri mittareista tietojoukosta, mukaan lukien:
- Merkintöjen kokonaismäärä;
- Keskiarvo tai keskimääräinen arvo;
- Keskihajonta;
- Pienimmät ja suurimmat arvot;
- 25., 50. (mediaani) ja 75. prosenttipisteet.
Tehtävä
Swipe to start coding
Sinulle annetaan DataFrame
nimeltä wine_data
.
- Laske
'residual sugar'
-sarakkeen keskiarvo ja tallenna tulosresidual_sugar_mean
-muuttujaan. - Laske
'fixed acidity'
-sarakkeen moodi ja tallenna tulosfixed_acidity_mode
-muuttujaan. - Hae yleiskatsaus eri tilastoista
wine_data
:sta ja tallenna tulosdescribed_data
-muuttujaan.
Ratkaisu
Oliko kaikki selvää?
Kiitos palautteestasi!