single
Rellenando los Valores Faltantes
Desliza para mostrar el menú
Eliminar los valores faltantes no es la única manera de deshacerse de ellos. También puedes reemplazar todos los NaN por un valor definido, por ejemplo, con el valor medio de la columna o con ceros. Esto puede ser útil en muchos casos. Aprenderás esto en el curso Learning Statistics with Python.
Observa el ejemplo de cómo rellenar los valores faltantes en la columna 'Age' con el valor mediano de esta columna:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Explicación:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()- usando el argumentovalue, indicamos al método.fillna()qué hacer con los valoresNaN. En este caso, aplicamos el método.fillna()a la columna'Age'y reemplazamos todos los valores faltantes por la mediana de la columna;inplace=True- argumento que se puede usar para guardar los cambios.
Desliza para comenzar a programar
Los valores faltantes pueden causar problemas al analizar datos. Una de las formas más comunes de tratarlos es reemplazando los valores faltantes por la media de la columna.
Tu tarea es:
- Reemplazar todos los valores
NaNen la columna'Age'por la media de esa columna.
- Utiliza el método
.fillna()con los argumentosvalue=data['Age'].mean()einplace=True.
- Calcular e imprimir el número de valores faltantes restantes en la columna
'Age'.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla