Коваріація
Коваріація — це міра спільної змінності двох випадкових змінних.
Формули для вибіркової та генеральної коваріації відрізняються, але тут вони не розглядатимуться детально. У цьому розділі розглядається обчислення коваріації для наступного набору даних:
Store_ID: the unique id of the store;Store_Area: the area of the store;Items_Available: the number of items that are available in the store;Daily_Customer_Count: the daily number of customers in the store;Store_Sales: the number of sales in the store.
Обчислення коваріації за допомогою Python
Для обчислення коваріації у Python використовуйте функцію np.cov() з бібліотеки NumPy. Вона приймає два параметри: послідовності даних, для яких потрібно розрахувати коваріацію.
Результат знаходиться за індексом [0,1]. У цьому курсі інші значення вихідних даних не розглядаються, зверніться до прикладу:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Це свідчить про те, що значення змінюються в одному напрямку. Це логічно, оскільки більша площа магазину відповідає більшій кількості товарів. Одним із суттєвих недоліків коваріації є те, що її значення може бути нескінченним.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain what the other values in the np.cov() output mean?
How does covariance differ from correlation?
Can you show how to interpret a negative covariance with an example?
Awesome!
Completion rate improved to 2.63
Коваріація
Свайпніть щоб показати меню
Коваріація — це міра спільної змінності двох випадкових змінних.
Формули для вибіркової та генеральної коваріації відрізняються, але тут вони не розглядатимуться детально. У цьому розділі розглядається обчислення коваріації для наступного набору даних:
Store_ID: the unique id of the store;Store_Area: the area of the store;Items_Available: the number of items that are available in the store;Daily_Customer_Count: the daily number of customers in the store;Store_Sales: the number of sales in the store.
Обчислення коваріації за допомогою Python
Для обчислення коваріації у Python використовуйте функцію np.cov() з бібліотеки NumPy. Вона приймає два параметри: послідовності даних, для яких потрібно розрахувати коваріацію.
Результат знаходиться за індексом [0,1]. У цьому курсі інші значення вихідних даних не розглядаються, зверніться до прикладу:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Це свідчить про те, що значення змінюються в одному напрямку. Це логічно, оскільки більша площа магазину відповідає більшій кількості товарів. Одним із суттєвих недоліків коваріації є те, що її значення може бути нескінченним.
Дякуємо за ваш відгук!