Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Eliminando Valores Faltantes | Procesamiento de Datos Cuantitativos
Procesamiento Previo de Datos
course content

Contenido del Curso

Procesamiento Previo de Datos

Procesamiento Previo de Datos

1. Introducción Breve
2. Procesamiento de Datos Cuantitativos
3. Procesamiento de Datos Categóricos
4. Procesamiento de Datos de Series Temporales
5. Ingeniería de Características
6. Avanzando a Tareas

book
Eliminando Valores Faltantes

Eliminar los valores que faltan de los conjuntos de datos es un paso importante para garantizar la calidad y precisión del análisis de datos y de los modelos. Ayuda a evitar problemas de datos incompletos, resultados sesgados, bajo rendimiento de los modelos e integridad de los datos. Pero es importante considerar cuidadosamente las implicaciones de la eliminación de valores perdidos y elegir un método apropiado para tratarlos, como la imputación o la eliminación, dependiendo de la situación específica.

Para eliminar valores omitidos en Python, puede utilizar el método .dropna() de la biblioteca pandas. Esta función elimina cualquier fila o columna que contenga valores perdidos en un conjunto de datos.

He aquí un ejemplo:

12345678910
import pandas as pd import numpy as np # Load dataset dataset = pd.DataFrame(np.array([[10, 2, np.nan], [5, 0.3, 9], [np.nan, 12, 8], [11, 12, 8]])) print('Dataset is:\n', dataset) # Drop rows with missing values dataset = dataset.dropna() print('Cleaned dataset is:\n', dataset)
copy

Es importante tener en cuenta que la eliminación de valores omitidos puede dar lugar a una pérdida de información, por lo que es importante considerar las implicaciones de eliminarlos antes de hacerlo. En algunos casos, puede ser conveniente imputar los valores perdidos en lugar de eliminarlos.

Además, queremos recordarle que la sustitución de valores perdidos por valores medios puede utilizarse para manejar datos perdidos en Python. Se suele utilizar cuando los datos que faltan son datos perdidos al azar (MAR), lo que significa que los valores que faltan no están relacionados con el valor real de los datos que faltan.

Tarea
test

Swipe to show code editor

Eliminar los valores que faltan en el conjunto de datos 'titanic.csv'.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 4
toggle bottom row

book
Eliminando Valores Faltantes

Eliminar los valores que faltan de los conjuntos de datos es un paso importante para garantizar la calidad y precisión del análisis de datos y de los modelos. Ayuda a evitar problemas de datos incompletos, resultados sesgados, bajo rendimiento de los modelos e integridad de los datos. Pero es importante considerar cuidadosamente las implicaciones de la eliminación de valores perdidos y elegir un método apropiado para tratarlos, como la imputación o la eliminación, dependiendo de la situación específica.

Para eliminar valores omitidos en Python, puede utilizar el método .dropna() de la biblioteca pandas. Esta función elimina cualquier fila o columna que contenga valores perdidos en un conjunto de datos.

He aquí un ejemplo:

12345678910
import pandas as pd import numpy as np # Load dataset dataset = pd.DataFrame(np.array([[10, 2, np.nan], [5, 0.3, 9], [np.nan, 12, 8], [11, 12, 8]])) print('Dataset is:\n', dataset) # Drop rows with missing values dataset = dataset.dropna() print('Cleaned dataset is:\n', dataset)
copy

Es importante tener en cuenta que la eliminación de valores omitidos puede dar lugar a una pérdida de información, por lo que es importante considerar las implicaciones de eliminarlos antes de hacerlo. En algunos casos, puede ser conveniente imputar los valores perdidos en lugar de eliminarlos.

Además, queremos recordarle que la sustitución de valores perdidos por valores medios puede utilizarse para manejar datos perdidos en Python. Se suele utilizar cuando los datos que faltan son datos perdidos al azar (MAR), lo que significa que los valores que faltan no están relacionados con el valor real de los datos que faltan.

Tarea
test

Swipe to show code editor

Eliminar los valores que faltan en el conjunto de datos 'titanic.csv'.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 4
Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
We're sorry to hear that something went wrong. What happened?
some-alt