Aprende Estadística Descriptiva | Verificación de Normalidad

Desliza para mostrar el menú

Antes de pasar a la visualización de la distribución, conviene examinar las estadísticas descriptivas de cada parámetro del conjunto de datos.

Entre los parámetros clave que necesitamos están los siguientes:

Número de observaciones;
Valor medio;
Desviación típica;
Mediana;
Valor mínimo;
Valor máximo.

Manos a la obra. Tenemos los resultados de un experimento controlado para dos grupos de usuarios.

Las pruebas preliminares A/A mostraron que el experimento era adecuado. Vamos a mostrar nuestros archivos:


              12345678
            
# Import pandas 
import pandas as pd

# Read .csv file 
df_control = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_control.csv', delimiter=';')

# Print head of the control dataframe
print(df_control.head())

En esta tabla, tenemos 4 columnas:

'Impresión' - el número de visitas a la página del producto; 'Click' - el número de transiciones a la página del producto; Compra: número de compras del producto; 'Ganancia' - beneficio de la venta del producto.


              12345678
            
# Import pandas
import pandas as pd

# Read .csv file
df_test = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_test.csv', delimiter=';')

# Print head of the test dataframe
print(df_test.head())

Ahora vamos a calcular los estadísticos descriptivos y mostrarlos en la pantalla:


              12345678910111213141516
            
# Import pandas
import pandas as pd

# Read .csv files
df_control = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_control.csv', delimiter=';')
df_test = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_test.csv', delimiter=';')

# Calculate descriptive statistics using .agg method
control_descriptive = df_control['Impression'].agg(['count', 'mean', 'std', 'median', 'min', 'max']).round(2)
test_descriptive = df_test['Impression'].agg(['count', 'mean', 'std', 'median', 'min', 'max']).round(2)

# Concat the results of aggregations
result = pd.concat([control_descriptive, test_descriptive], axis=1)
result.columns = ['Control', 'Test']

print(result)

Utilizamos el método .agg() para calcular estadísticas descriptivas. Este método se denomina agregación. Las agregaciones son una forma de colapsar, resumir o agrupar datos. Además, utilizamos el método .concat() para mostrar convenientemente los resultados de la agregación en la pantalla.

**Los promedios parecen bastante cercanos. ¿O no?

¿Todo estuvo claro?

¡Gracias por tus comentarios!

Sección 2. Capítulo 2

Pregunte a AI

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Sección 2. Capítulo 2