Contenido del Curso
Análisis de Series Temporales
Análisis de Series Temporales
Estacionariedad
En el análisis de series temporales, la estacionariedad se refiere a una característica de un proceso estocástico en la que las propiedades estadísticas del proceso no cambian con el tiempo. La media, la varianza y la estructura de autocorrelación del proceso permanecen constantes.
Ejemplo de datos estacionarios:
Y datos no estacionarios:
**¿Por qué es importante esta función para nosotros?
Su presencia es un criterio a la hora de seleccionar los modelos que puede utilizar para predecir los datos. Si los datos son estacionarios, se pueden utilizar diversos modelos (autoregresión, media móvil, regresión lineal, etc.). En cambio, no existen modelos universales para predecir procesos no estacionarios: algunas series temporales no estacionarias pueden convertirse en estacionarias mediante algunas manipulaciones matemáticas (modelo ARIMA); otras series temporales no estacionarias pueden predecirse utilizando tipos especiales de redes neuronales.
Pasemos ahora a comprobar la estacionariedad de los datos. Para ello se pueden utilizar pruebas estadísticas denominadas "Pruebas de raíz unitaria". Existen pruebas como:
- Prueba Dickey-Fuller aumentada;
- Kwiatkowski-Phillips-Schmidt-Shin**;
- Prueba de Philips Perron.
En la mayoría de los casos, utilizaremos la prueba de Dickey-Fuller aumentada (ADF), pero puede tener en cuenta los resultados de otras pruebas.
Usando la librería statsmodel
, determinaremos si los datos son estacionarios. Esto se hace en unas pocas líneas de código:
``python from statsmodels.tsa.stattools import adfuller import pandas as pd
dataset = pd.read_csv("series_tiempo.csv", parse_dates=["fecha"])
Prueba ADF
result = adfuller(dataset["Precio"], autolag="AIC") print("Estadístico ADF: %f" % (resultado[0])) print("Valor p: %f" % (resultado[1])) ```
¿Cómo interpretar los resultados obtenidos?
La hipótesis nula de esta prueba es que la serie temporal no es estacionaria. Si el valor p es inferior a cierto nivel (por ejemplo, 0,05), podemos rechazar la hipótesis nula y concluir que la serie temporal es estacionaria.
Veamos el valor p anterior. Es igual a 1,0, lo que significa que no podemos rechazar la hipótesis nula y que nuestros datos no son estacionarios. La hipótesis nula sería falsa si el valor p fuera inferior a 0,05.
Tarea
Compruebe la estacionariedad del conjunto de datos daily-total-female-births.csv
.
- Importe
adfuller
destatsmodels.tsa.stattools
.
- Importe
- Lea el archivo
csv
.
- Lea el archivo
- Realice la prueba Dickey-Fuller aumentada para la columna "Nacimientos" de los datos.
¡Gracias por tus comentarios!
Estacionariedad
En el análisis de series temporales, la estacionariedad se refiere a una característica de un proceso estocástico en la que las propiedades estadísticas del proceso no cambian con el tiempo. La media, la varianza y la estructura de autocorrelación del proceso permanecen constantes.
Ejemplo de datos estacionarios:
Y datos no estacionarios:
**¿Por qué es importante esta función para nosotros?
Su presencia es un criterio a la hora de seleccionar los modelos que puede utilizar para predecir los datos. Si los datos son estacionarios, se pueden utilizar diversos modelos (autoregresión, media móvil, regresión lineal, etc.). En cambio, no existen modelos universales para predecir procesos no estacionarios: algunas series temporales no estacionarias pueden convertirse en estacionarias mediante algunas manipulaciones matemáticas (modelo ARIMA); otras series temporales no estacionarias pueden predecirse utilizando tipos especiales de redes neuronales.
Pasemos ahora a comprobar la estacionariedad de los datos. Para ello se pueden utilizar pruebas estadísticas denominadas "Pruebas de raíz unitaria". Existen pruebas como:
- Prueba Dickey-Fuller aumentada;
- Kwiatkowski-Phillips-Schmidt-Shin**;
- Prueba de Philips Perron.
En la mayoría de los casos, utilizaremos la prueba de Dickey-Fuller aumentada (ADF), pero puede tener en cuenta los resultados de otras pruebas.
Usando la librería statsmodel
, determinaremos si los datos son estacionarios. Esto se hace en unas pocas líneas de código:
``python from statsmodels.tsa.stattools import adfuller import pandas as pd
dataset = pd.read_csv("series_tiempo.csv", parse_dates=["fecha"])
Prueba ADF
result = adfuller(dataset["Precio"], autolag="AIC") print("Estadístico ADF: %f" % (resultado[0])) print("Valor p: %f" % (resultado[1])) ```
¿Cómo interpretar los resultados obtenidos?
La hipótesis nula de esta prueba es que la serie temporal no es estacionaria. Si el valor p es inferior a cierto nivel (por ejemplo, 0,05), podemos rechazar la hipótesis nula y concluir que la serie temporal es estacionaria.
Veamos el valor p anterior. Es igual a 1,0, lo que significa que no podemos rechazar la hipótesis nula y que nuestros datos no son estacionarios. La hipótesis nula sería falsa si el valor p fuera inferior a 0,05.
Tarea
Compruebe la estacionariedad del conjunto de datos daily-total-female-births.csv
.
- Importe
adfuller
destatsmodels.tsa.stattools
.
- Importe
- Lea el archivo
csv
.
- Lea el archivo
- Realice la prueba Dickey-Fuller aumentada para la columna "Nacimientos" de los datos.
¡Gracias por tus comentarios!
Estacionariedad
En el análisis de series temporales, la estacionariedad se refiere a una característica de un proceso estocástico en la que las propiedades estadísticas del proceso no cambian con el tiempo. La media, la varianza y la estructura de autocorrelación del proceso permanecen constantes.
Ejemplo de datos estacionarios:
Y datos no estacionarios:
**¿Por qué es importante esta función para nosotros?
Su presencia es un criterio a la hora de seleccionar los modelos que puede utilizar para predecir los datos. Si los datos son estacionarios, se pueden utilizar diversos modelos (autoregresión, media móvil, regresión lineal, etc.). En cambio, no existen modelos universales para predecir procesos no estacionarios: algunas series temporales no estacionarias pueden convertirse en estacionarias mediante algunas manipulaciones matemáticas (modelo ARIMA); otras series temporales no estacionarias pueden predecirse utilizando tipos especiales de redes neuronales.
Pasemos ahora a comprobar la estacionariedad de los datos. Para ello se pueden utilizar pruebas estadísticas denominadas "Pruebas de raíz unitaria". Existen pruebas como:
- Prueba Dickey-Fuller aumentada;
- Kwiatkowski-Phillips-Schmidt-Shin**;
- Prueba de Philips Perron.
En la mayoría de los casos, utilizaremos la prueba de Dickey-Fuller aumentada (ADF), pero puede tener en cuenta los resultados de otras pruebas.
Usando la librería statsmodel
, determinaremos si los datos son estacionarios. Esto se hace en unas pocas líneas de código:
``python from statsmodels.tsa.stattools import adfuller import pandas as pd
dataset = pd.read_csv("series_tiempo.csv", parse_dates=["fecha"])
Prueba ADF
result = adfuller(dataset["Precio"], autolag="AIC") print("Estadístico ADF: %f" % (resultado[0])) print("Valor p: %f" % (resultado[1])) ```
¿Cómo interpretar los resultados obtenidos?
La hipótesis nula de esta prueba es que la serie temporal no es estacionaria. Si el valor p es inferior a cierto nivel (por ejemplo, 0,05), podemos rechazar la hipótesis nula y concluir que la serie temporal es estacionaria.
Veamos el valor p anterior. Es igual a 1,0, lo que significa que no podemos rechazar la hipótesis nula y que nuestros datos no son estacionarios. La hipótesis nula sería falsa si el valor p fuera inferior a 0,05.
Tarea
Compruebe la estacionariedad del conjunto de datos daily-total-female-births.csv
.
- Importe
adfuller
destatsmodels.tsa.stattools
.
- Importe
- Lea el archivo
csv
.
- Lea el archivo
- Realice la prueba Dickey-Fuller aumentada para la columna "Nacimientos" de los datos.
¡Gracias por tus comentarios!
En el análisis de series temporales, la estacionariedad se refiere a una característica de un proceso estocástico en la que las propiedades estadísticas del proceso no cambian con el tiempo. La media, la varianza y la estructura de autocorrelación del proceso permanecen constantes.
Ejemplo de datos estacionarios:
Y datos no estacionarios:
**¿Por qué es importante esta función para nosotros?
Su presencia es un criterio a la hora de seleccionar los modelos que puede utilizar para predecir los datos. Si los datos son estacionarios, se pueden utilizar diversos modelos (autoregresión, media móvil, regresión lineal, etc.). En cambio, no existen modelos universales para predecir procesos no estacionarios: algunas series temporales no estacionarias pueden convertirse en estacionarias mediante algunas manipulaciones matemáticas (modelo ARIMA); otras series temporales no estacionarias pueden predecirse utilizando tipos especiales de redes neuronales.
Pasemos ahora a comprobar la estacionariedad de los datos. Para ello se pueden utilizar pruebas estadísticas denominadas "Pruebas de raíz unitaria". Existen pruebas como:
- Prueba Dickey-Fuller aumentada;
- Kwiatkowski-Phillips-Schmidt-Shin**;
- Prueba de Philips Perron.
En la mayoría de los casos, utilizaremos la prueba de Dickey-Fuller aumentada (ADF), pero puede tener en cuenta los resultados de otras pruebas.
Usando la librería statsmodel
, determinaremos si los datos son estacionarios. Esto se hace en unas pocas líneas de código:
``python from statsmodels.tsa.stattools import adfuller import pandas as pd
dataset = pd.read_csv("series_tiempo.csv", parse_dates=["fecha"])
Prueba ADF
result = adfuller(dataset["Precio"], autolag="AIC") print("Estadístico ADF: %f" % (resultado[0])) print("Valor p: %f" % (resultado[1])) ```
¿Cómo interpretar los resultados obtenidos?
La hipótesis nula de esta prueba es que la serie temporal no es estacionaria. Si el valor p es inferior a cierto nivel (por ejemplo, 0,05), podemos rechazar la hipótesis nula y concluir que la serie temporal es estacionaria.
Veamos el valor p anterior. Es igual a 1,0, lo que significa que no podemos rechazar la hipótesis nula y que nuestros datos no son estacionarios. La hipótesis nula sería falsa si el valor p fuera inferior a 0,05.
Tarea
Compruebe la estacionariedad del conjunto de datos daily-total-female-births.csv
.
- Importe
adfuller
destatsmodels.tsa.stattools
.
- Importe
- Lea el archivo
csv
.
- Lea el archivo
- Realice la prueba Dickey-Fuller aumentada para la columna "Nacimientos" de los datos.