Datan Kuvaileminen
pandas tarjoaa kätevän mean()-menetelmän, joka laskee keskiarvon kaikista arvoista jokaisessa sarakkeessa.
df = pd.read_csv(file.csv)
mean_values = df.mean()
Samaa menetelmää voidaan käyttää myös tietyn sarakkeen keskiarvon määrittämiseen:
df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()
pandas tarjoaa myös mode()-menetelmän, joka tunnistaa yleisimmin esiintyvän arvon jokaisessa sarakkeessa.
df = pd.read_csv(file.csv)
mode_values = df.mode()
Tietyn sarakkeen moodin löytämiseen käytetään samaa menetelmää:
df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Käytä [0] .mode()-metodin jälkeen saadaksesi ensimmäisen arvon, jos useita moodeja löytyy. Ilman tätä metodi palauttaa koko Series-olion.
Toinen hyödyllinen menetelmä pandas-kirjastossa on describe().
df = pd.read_csv(file.csv)
important_metrics = df.describe()
Tämä menetelmä tarjoaa yleiskatsauksen eri mittareista tietoaineistosta, mukaan lukien:
- Kokonaismäärä havaintoja;
- Keskiarvo;
- Keskihajonta;
- Pienin ja suurin arvo;
- 25., 50. (mediaani) ja 75. prosenttipiste.
Swipe to start coding
Sinulle on annettu DataFrame nimeltä wine_data.
- Laske sarakkeen
'residual sugar'keskiarvo ja tallenna tulos muuttujaanresidual_sugar_mean. - Laske sarakkeen
'fixed acidity'moodi ja tallenna tulos muuttujaanfixed_acidity_mode. - Hae yleiskatsaus erilaisista tilastollisista tunnusluvuista
wine_data:sta ja tallenna tulos muuttujaandescribed_data.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain what the output of the describe() method looks like?
How do I interpret the results from the mean() and mode() methods?
Are there other useful statistical methods in pandas I should know about?
Mahtavaa!
Completion arvosana parantunut arvoon 3.03
Datan Kuvaileminen
Pyyhkäise näyttääksesi valikon
pandas tarjoaa kätevän mean()-menetelmän, joka laskee keskiarvon kaikista arvoista jokaisessa sarakkeessa.
df = pd.read_csv(file.csv)
mean_values = df.mean()
Samaa menetelmää voidaan käyttää myös tietyn sarakkeen keskiarvon määrittämiseen:
df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()
pandas tarjoaa myös mode()-menetelmän, joka tunnistaa yleisimmin esiintyvän arvon jokaisessa sarakkeessa.
df = pd.read_csv(file.csv)
mode_values = df.mode()
Tietyn sarakkeen moodin löytämiseen käytetään samaa menetelmää:
df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Käytä [0] .mode()-metodin jälkeen saadaksesi ensimmäisen arvon, jos useita moodeja löytyy. Ilman tätä metodi palauttaa koko Series-olion.
Toinen hyödyllinen menetelmä pandas-kirjastossa on describe().
df = pd.read_csv(file.csv)
important_metrics = df.describe()
Tämä menetelmä tarjoaa yleiskatsauksen eri mittareista tietoaineistosta, mukaan lukien:
- Kokonaismäärä havaintoja;
- Keskiarvo;
- Keskihajonta;
- Pienin ja suurin arvo;
- 25., 50. (mediaani) ja 75. prosenttipiste.
Swipe to start coding
Sinulle on annettu DataFrame nimeltä wine_data.
- Laske sarakkeen
'residual sugar'keskiarvo ja tallenna tulos muuttujaanresidual_sugar_mean. - Laske sarakkeen
'fixed acidity'moodi ja tallenna tulos muuttujaanfixed_acidity_mode. - Hae yleiskatsaus erilaisista tilastollisista tunnusluvuista
wine_data:sta ja tallenna tulos muuttujaandescribed_data.
Ratkaisu
Kiitos palautteestasi!
single