Коваріація
Коваріація — це міра спільної змінності двох випадкових змінних.
Формули для вибіркової та генеральної коваріації відрізняються, але тут вони детально не розглядаються. У цьому розділі розглядається коваріація для наступного набору даних:
Store_ID
: the unique id of the store;Store_Area
: the area of the store;Items_Available
: the number of items that are available in the store;Daily_Customer_Count
: the daily number of customers in the store;Store_Sales
: the number of sales in the store.
Обчислення коваріації за допомогою Python
Для обчислення коваріації у Python використовуйте функцію np.cov()
з бібліотеки NumPy. Вона приймає два параметри: послідовності даних, для яких потрібно обчислити коваріацію.
Результат знаходиться за індексом [0,1]
. У цьому курсі інші значення вихідних даних не розглядаються, зверніться до прикладу:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Це означає, що значення змінюються в одному напрямку. Це логічно, оскільки більша площа магазину відповідає більшій кількості товарів. Одним із суттєвих недоліків коваріації є те, що її значення може бути нескінченним.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 2.63
Коваріація
Свайпніть щоб показати меню
Коваріація — це міра спільної змінності двох випадкових змінних.
Формули для вибіркової та генеральної коваріації відрізняються, але тут вони детально не розглядаються. У цьому розділі розглядається коваріація для наступного набору даних:
Store_ID
: the unique id of the store;Store_Area
: the area of the store;Items_Available
: the number of items that are available in the store;Daily_Customer_Count
: the daily number of customers in the store;Store_Sales
: the number of sales in the store.
Обчислення коваріації за допомогою Python
Для обчислення коваріації у Python використовуйте функцію np.cov()
з бібліотеки NumPy. Вона приймає два параметри: послідовності даних, для яких потрібно обчислити коваріацію.
Результат знаходиться за індексом [0,1]
. У цьому курсі інші значення вихідних даних не розглядаються, зверніться до прикладу:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Це означає, що значення змінюються в одному напрямку. Це логічно, оскільки більша площа магазину відповідає більшій кількості товарів. Одним із суттєвих недоліків коваріації є те, що її значення може бути нескінченним.
Дякуємо за ваш відгук!