Desafío: Predicción de Precios de Viviendas
Ahora construirá un modelo de regresión aplicado a un ejemplo del mundo real. Dispone de un archivo, houses_simple.csv, que contiene información sobre los precios de viviendas junto con su área como característica.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
El siguiente paso es asignar variables y visualizar el conjunto de datos:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
En el ejemplo con la altura de una persona, era mucho más fácil imaginar una línea que se ajustara bien a los datos.
Pero ahora nuestros datos tienen mucha más variabilidad, ya que el objetivo depende en gran medida de muchos otros factores como la antigüedad, la ubicación, el interior, etc.
De todas formas, la tarea es construir la línea que mejor se ajuste a los datos que tenemos; esto mostrará la tendencia. Para ello, se debe utilizar la clase OLS. Pronto aprenderemos cómo agregar más características, lo que mejorará la predicción.
Swipe to start coding
- Asignar la columna
'price'dedfay. - Crear la matriz
X_tildeutilizando la funciónadd_constant()destatsmodels(importada comosm). - Inicializar el objeto
OLSy entrenarlo. - Preprocesar el arreglo
X_newde la misma manera queX. - Predecir el objetivo para la matriz
X_new_tilde.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 5.26
Desafío: Predicción de Precios de Viviendas
Desliza para mostrar el menú
Ahora construirá un modelo de regresión aplicado a un ejemplo del mundo real. Dispone de un archivo, houses_simple.csv, que contiene información sobre los precios de viviendas junto con su área como característica.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
El siguiente paso es asignar variables y visualizar el conjunto de datos:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
En el ejemplo con la altura de una persona, era mucho más fácil imaginar una línea que se ajustara bien a los datos.
Pero ahora nuestros datos tienen mucha más variabilidad, ya que el objetivo depende en gran medida de muchos otros factores como la antigüedad, la ubicación, el interior, etc.
De todas formas, la tarea es construir la línea que mejor se ajuste a los datos que tenemos; esto mostrará la tendencia. Para ello, se debe utilizar la clase OLS. Pronto aprenderemos cómo agregar más características, lo que mejorará la predicción.
Swipe to start coding
- Asignar la columna
'price'dedfay. - Crear la matriz
X_tildeutilizando la funciónadd_constant()destatsmodels(importada comosm). - Inicializar el objeto
OLSy entrenarlo. - Preprocesar el arreglo
X_newde la misma manera queX. - Predecir el objetivo para la matriz
X_new_tilde.
Solución
¡Gracias por tus comentarios!
single