Кореляція
Кореляція — це статистична міра, яка кількісно визначає ступінь зв'язку або взаємозалежності між двома змінними. Іншими словами, вона допомагає зрозуміти, як дві змінні схильні змінюватися одна відносно одної.
Кореляція забезпечує простий спосіб аналізу результату. Значення кореляції знаходиться в діапазоні [-1, 1]
. Дивіться таблицю нижче:
Кореляція з Python
Для обчислення кореляції використовуйте функцію np.corrcoef()
з бібліотеки numpy
, яка потребує два параметри: послідовності даних, для яких обчислюється кореляція. Ось приклад:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
Тут ми витягли значення за індексом [0, 1]
, так само, як і у випадку з коваріацією. У попередньому розділі ми отримали значення 74955.85
, і інтерпретувати результат функції коваріації може бути складно. Однак у цьому випадку можна зробити висновок, що значення мають сильний зв'язок.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
What does a correlation value close to 1 or -1 mean in practical terms?
Can you explain the difference between correlation and covariance?
How should I interpret the correlation result from the code example?
Awesome!
Completion rate improved to 2.63
Кореляція
Свайпніть щоб показати меню
Кореляція — це статистична міра, яка кількісно визначає ступінь зв'язку або взаємозалежності між двома змінними. Іншими словами, вона допомагає зрозуміти, як дві змінні схильні змінюватися одна відносно одної.
Кореляція забезпечує простий спосіб аналізу результату. Значення кореляції знаходиться в діапазоні [-1, 1]
. Дивіться таблицю нижче:
Кореляція з Python
Для обчислення кореляції використовуйте функцію np.corrcoef()
з бібліотеки numpy
, яка потребує два параметри: послідовності даних, для яких обчислюється кореляція. Ось приклад:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
Тут ми витягли значення за індексом [0, 1]
, так само, як і у випадку з коваріацією. У попередньому розділі ми отримали значення 74955.85
, і інтерпретувати результат функції коваріації може бути складно. Однак у цьому випадку можна зробити висновок, що значення мають сильний зв'язок.
Дякуємо за ваш відгук!