Correlación
Correlación es una medida estadística que cuantifica el grado de asociación o relación entre dos variables. En otras palabras, ayuda a comprender cómo tienden a moverse dos variables en relación entre sí.
La correlación proporciona una forma sencilla de examinar el resultado. El valor de correlación se encuentra dentro del rango de [-1, 1]. Consulte la tabla a continuación:
Correlación con Python
Para calcular la correlación, utilice la función np.corrcoef() de numpy, que requiere dos parámetros: las secuencias de datos para las cuales se va a calcular la correlación. A continuación se muestra un ejemplo:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
Aquí, extraemos el valor en el índice [0, 1], igual que en el caso de la covarianza. En el capítulo anterior, obtuvimos el valor 74955.85, y la interpretación del resultado de la función de covariación puede ser compleja. Sin embargo, en este caso, se puede concluir que los valores están fuertemente relacionados.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Genial!
Completion tasa mejorada a 2.63
Correlación
Desliza para mostrar el menú
Correlación es una medida estadística que cuantifica el grado de asociación o relación entre dos variables. En otras palabras, ayuda a comprender cómo tienden a moverse dos variables en relación entre sí.
La correlación proporciona una forma sencilla de examinar el resultado. El valor de correlación se encuentra dentro del rango de [-1, 1]. Consulte la tabla a continuación:
Correlación con Python
Para calcular la correlación, utilice la función np.corrcoef() de numpy, que requiere dos parámetros: las secuencias de datos para las cuales se va a calcular la correlación. A continuación se muestra un ejemplo:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
Aquí, extraemos el valor en el índice [0, 1], igual que en el caso de la covarianza. En el capítulo anterior, obtuvimos el valor 74955.85, y la interpretación del resultado de la función de covariación puede ser compleja. Sin embargo, en este caso, se puede concluir que los valores están fuertemente relacionados.
¡Gracias por tus comentarios!