Correlação
Correlação é uma medida estatística que quantifica o grau de associação ou relação entre duas variáveis. Em outras palavras, auxilia na compreensão de como duas variáveis tendem a se mover em relação uma à outra.
A correlação fornece uma maneira direta de analisar o resultado. O valor da correlação está dentro do intervalo [-1, 1]. Consulte a tabela abaixo:
Correlação com Python
Para calcular a correlação, utilize a função np.corrcoef() do numpy, que requer dois parâmetros: as sequências de dados para as quais a correlação será calculada. Veja um exemplo:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
Aqui, extraímos o valor no índice [0, 1], assim como no caso da covariância. No capítulo anterior, obtivemos o valor 74955.85, e interpretar o resultado da função de covariância pode ser desafiador. No entanto, neste caso, é possível concluir que os valores estão fortemente relacionados.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
What does a correlation value close to 1 or -1 mean in practical terms?
Can you explain the difference between correlation and covariance?
How should I interpret the correlation result from the code example?
Awesome!
Completion rate improved to 2.63
Correlação
Deslize para mostrar o menu
Correlação é uma medida estatística que quantifica o grau de associação ou relação entre duas variáveis. Em outras palavras, auxilia na compreensão de como duas variáveis tendem a se mover em relação uma à outra.
A correlação fornece uma maneira direta de analisar o resultado. O valor da correlação está dentro do intervalo [-1, 1]. Consulte a tabela abaixo:
Correlação com Python
Para calcular a correlação, utilize a função np.corrcoef() do numpy, que requer dois parâmetros: as sequências de dados para as quais a correlação será calculada. Veja um exemplo:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
Aqui, extraímos o valor no índice [0, 1], assim como no caso da covariância. No capítulo anterior, obtivemos o valor 74955.85, e interpretar o resultado da função de covariância pode ser desafiador. No entanto, neste caso, é possível concluir que os valores estão fortemente relacionados.
Obrigado pelo seu feedback!