Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Коваріація | Коваріація проти Кореляції
Вивчення Статистики з Python

bookКоваріація

Коваріація — це міра спільної змінності двох випадкових змінних.

Формули для вибіркової та генеральної коваріації відрізняються, але тут вони детально не розглядаються. У цьому розділі розглядається коваріація для наступного набору даних:

  • Store_ID: the unique id of the store;
  • Store_Area: the area of the store;
  • Items_Available: the number of items that are available in the store;
  • Daily_Customer_Count: the daily number of customers in the store;
  • Store_Sales: the number of sales in the store.

Обчислення коваріації за допомогою Python

Для обчислення коваріації у Python використовуйте функцію np.cov() з бібліотеки NumPy. Вона приймає два параметри: послідовності даних, для яких потрібно обчислити коваріацію.

Результат знаходиться за індексом [0,1]. У цьому курсі інші значення вихідних даних не розглядаються, зверніться до прикладу:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
copy

Це означає, що значення змінюються в одному напрямку. Це логічно, оскільки більша площа магазину відповідає більшій кількості товарів. Одним із суттєвих недоліків коваріації є те, що її значення може бути нескінченним.

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 1

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Awesome!

Completion rate improved to 2.63

bookКоваріація

Свайпніть щоб показати меню

Коваріація — це міра спільної змінності двох випадкових змінних.

Формули для вибіркової та генеральної коваріації відрізняються, але тут вони детально не розглядаються. У цьому розділі розглядається коваріація для наступного набору даних:

  • Store_ID: the unique id of the store;
  • Store_Area: the area of the store;
  • Items_Available: the number of items that are available in the store;
  • Daily_Customer_Count: the daily number of customers in the store;
  • Store_Sales: the number of sales in the store.

Обчислення коваріації за допомогою Python

Для обчислення коваріації у Python використовуйте функцію np.cov() з бібліотеки NumPy. Вона приймає два параметри: послідовності даних, для яких потрібно обчислити коваріацію.

Результат знаходиться за індексом [0,1]. У цьому курсі інші значення вихідних даних не розглядаються, зверніться до прикладу:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
copy

Це означає, що значення змінюються в одному напрямку. Це логічно, оскільки більша площа магазину відповідає більшій кількості товарів. Одним із суттєвих недоліків коваріації є те, що її значення може бути нескінченним.

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 1
some-alt