Contenido del Curso
Procesamiento Previo de Datos
Procesamiento Previo de Datos
Tipos de Datos
La principal herramienta que utilizaremos para manipular los datos es pandas
. Podemos empezar inmediatamente cargando los datos:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.head())
Como comprenderá, cada conjunto de datos puede contener muchos tipos de datos diferentes, por ejemplo, numéricos (enteros, números de coma flotante), cadenas (str) y datetime. Para saber qué tipo de datos tiene una columna, puedes llamar a la propiedad .dtypes
:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.dtypes)
Supongamos que tienes una columna con valores numéricos pero en formato cadena y quieres cambiar el tipo de datos a numérico. Para ello, utilice el método .astype()
:
Swipe to show code editor
Lee el conjunto de datos penguins.csv
y cambia el tipo de datos de la columna body_mass_g
de float
a int
.
No modifiques el código inicial, sólo sustituye los huecos ___
por el código correcto.
Una vez que hayas completado esta tarea, haz clic en el debajo del código para comprobar tu solución.
Solución
¡Gracias por tus comentarios!
Tipos de Datos
La principal herramienta que utilizaremos para manipular los datos es pandas
. Podemos empezar inmediatamente cargando los datos:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.head())
Como comprenderá, cada conjunto de datos puede contener muchos tipos de datos diferentes, por ejemplo, numéricos (enteros, números de coma flotante), cadenas (str) y datetime. Para saber qué tipo de datos tiene una columna, puedes llamar a la propiedad .dtypes
:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.dtypes)
Supongamos que tienes una columna con valores numéricos pero en formato cadena y quieres cambiar el tipo de datos a numérico. Para ello, utilice el método .astype()
:
Swipe to show code editor
Lee el conjunto de datos penguins.csv
y cambia el tipo de datos de la columna body_mass_g
de float
a int
.
No modifiques el código inicial, sólo sustituye los huecos ___
por el código correcto.
Una vez que hayas completado esta tarea, haz clic en el debajo del código para comprobar tu solución.
Solución
¡Gracias por tus comentarios!