Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Коваріація | Коваріація та Кореляція
Вивчення Статистики з Використанням Python
course content

Зміст курсу

Вивчення Статистики з Використанням Python

Вивчення Статистики з Використанням Python

1. Основні Поняття
2. Середнє, Медіана та Мода в Python
3. Дисперсія та Стандартне Відхилення
4. Коваріація та Кореляція
5. Довірчий Інтервал
6. Статистичні Тести

bookКоваріація

Коваріація - це міра спільної мінливості двох випадкових величин.

Значення коваріаціїІнтерпретація
ДодатнеДві змінні рухаються в одному напрямку
0Дві змінні не мають лінійного зв'язку
Від'ємнеДві змінні рухаються в протилежних напрямках

Формули відрізняються для вибірки та генеральної сукупності, але ми не будемо заглиблюватися в них. У цьому розділі ми розглянемо коваріації наступного набору даних:

Store_IDStore_AreaItems_AvailableDaily_Customer_CountStore_Sales
001659196153066490
111461175221039820
221340160972054010
331451174862053730
441770211145046620
  • Store_ID - Унікальний ідентифікатор магазину.
  • Store_Area - Площа магазину.
  • Items_Available - Кількість товарів, які доступні в магазині.
  • Daily_Customer_Count - Щоденна кількість покупців у магазині.
  • Store_Sales - Кількість продажів у магазині.

Обчислення коваріації за допомогою Python

Для обчислення коваріації в Python можна скористатися функцією np.cov() з бібліотеки NumPy. Вона має два параметри: послідовності даних, для яких ви хочете обчислити коваріацію.

Результатом є значення за індексом [0,1]. У цьому курсі не розглядаються інші значення серед вихідних, подивіться на приклад:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
copy

Це вказує на те, що значення рухаються в одному напрямку. Це логічно, оскільки більша площа магазину відповідає більшій кількості товарів. Одним із суттєвих недоліків коваріації є те, що значення може бути нескінченним.

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 1
some-alt