Estadística Descriptiva
Antes de pasar a la visualización de la distribución, conviene examinar las estadísticas descriptivas de cada parámetro del conjunto de datos.
Entre los parámetros clave que necesitamos están los siguientes:
- Número de observaciones;
- Valor medio;
- Desviación típica;
- Mediana;
- Valor mínimo;
- Valor máximo.
Manos a la obra. Tenemos los resultados de un experimento controlado para dos grupos de usuarios.
Las pruebas preliminares A/A mostraron que el experimento era adecuado. Vamos a mostrar nuestros archivos:
12345678# Import pandas import pandas as pd # Read .csv file df_control = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_control.csv', delimiter=';') # Print head of the control dataframe print(df_control.head())
En esta tabla, tenemos 4 columnas:
'Impresión'
- el número de visitas a la página del producto;
'Click'
- el número de transiciones a la página del producto;
Compra: número de compras del producto;
'Ganancia'
- beneficio de la venta del producto.
12345678# Import pandas import pandas as pd # Read .csv file df_test = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_test.csv', delimiter=';') # Print head of the test dataframe print(df_test.head())
Ahora vamos a calcular los estadísticos descriptivos y mostrarlos en la pantalla:
12345678910111213141516# Import pandas import pandas as pd # Read .csv files df_control = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_control.csv', delimiter=';') df_test = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_test.csv', delimiter=';') # Calculate descriptive statistics using .agg method control_descriptive = df_control['Impression'].agg(['count', 'mean', 'std', 'median', 'min', 'max']).round(2) test_descriptive = df_test['Impression'].agg(['count', 'mean', 'std', 'median', 'min', 'max']).round(2) # Concat the results of aggregations result = pd.concat([control_descriptive, test_descriptive], axis=1) result.columns = ['Control', 'Test'] print(result)
Utilizamos el método .agg()
para calcular estadísticas descriptivas. Este método se denomina agregación. Las agregaciones son una forma de colapsar, resumir o agrupar datos.
Además, utilizamos el método .concat()
para mostrar convenientemente los resultados de la agregación en la pantalla.
**Los promedios parecen bastante cercanos. ¿O no?
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Pregunte me preguntas sobre este tema
Resumir este capítulo
Mostrar ejemplos del mundo real
Awesome!
Completion rate improved to 3.23
Estadística Descriptiva
Desliza para mostrar el menú
Antes de pasar a la visualización de la distribución, conviene examinar las estadísticas descriptivas de cada parámetro del conjunto de datos.
Entre los parámetros clave que necesitamos están los siguientes:
- Número de observaciones;
- Valor medio;
- Desviación típica;
- Mediana;
- Valor mínimo;
- Valor máximo.
Manos a la obra. Tenemos los resultados de un experimento controlado para dos grupos de usuarios.
Las pruebas preliminares A/A mostraron que el experimento era adecuado. Vamos a mostrar nuestros archivos:
12345678# Import pandas import pandas as pd # Read .csv file df_control = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_control.csv', delimiter=';') # Print head of the control dataframe print(df_control.head())
En esta tabla, tenemos 4 columnas:
'Impresión'
- el número de visitas a la página del producto;
'Click'
- el número de transiciones a la página del producto;
Compra: número de compras del producto;
'Ganancia'
- beneficio de la venta del producto.
12345678# Import pandas import pandas as pd # Read .csv file df_test = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_test.csv', delimiter=';') # Print head of the test dataframe print(df_test.head())
Ahora vamos a calcular los estadísticos descriptivos y mostrarlos en la pantalla:
12345678910111213141516# Import pandas import pandas as pd # Read .csv files df_control = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_control.csv', delimiter=';') df_test = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_test.csv', delimiter=';') # Calculate descriptive statistics using .agg method control_descriptive = df_control['Impression'].agg(['count', 'mean', 'std', 'median', 'min', 'max']).round(2) test_descriptive = df_test['Impression'].agg(['count', 'mean', 'std', 'median', 'min', 'max']).round(2) # Concat the results of aggregations result = pd.concat([control_descriptive, test_descriptive], axis=1) result.columns = ['Control', 'Test'] print(result)
Utilizamos el método .agg()
para calcular estadísticas descriptivas. Este método se denomina agregación. Las agregaciones son una forma de colapsar, resumir o agrupar datos.
Además, utilizamos el método .concat()
para mostrar convenientemente los resultados de la agregación en la pantalla.
**Los promedios parecen bastante cercanos. ¿O no?
¡Gracias por tus comentarios!