Desafío: Predicción de Precios de Viviendas
Ahora construirás un modelo de regresión aplicado a un ejemplo del mundo real. Dispones de un archivo, houses_simple.csv, que contiene información sobre los precios de viviendas junto con su área como característica.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
El siguiente paso es asignar variables y visualizar el conjunto de datos:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
En el ejemplo con la altura de una persona, era mucho más sencillo imaginar una línea que se ajustara bien a los datos.
Sin embargo, ahora nuestros datos presentan mucha más variabilidad, ya que el objetivo depende en gran medida de otros factores como la edad, la ubicación, el interior, etc.
De todas formas, la tarea consiste en construir la línea que mejor se ajuste a los datos disponibles; esto mostrará la tendencia. Para ello, se debe utilizar la clase OLS. Pronto aprenderemos cómo añadir más características, lo que mejorará la predicción.
Swipe to start coding
- Asignar la columna
'price'dedfay. - Crear la matriz
X_tildeutilizando la funciónadd_constant()destatsmodels(importada comosm). - Inicializar el objeto
OLSy entrenarlo. - Preprocesar el arreglo
X_newde la misma manera queX. - Predecir el objetivo para la matriz
X_new_tilde.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
What is the OLS class and how do I use it for regression?
Can you explain why adding more features improves prediction?
What does the scatter plot tell us about the data?
Awesome!
Completion rate improved to 5.26
Desafío: Predicción de Precios de Viviendas
Desliza para mostrar el menú
Ahora construirás un modelo de regresión aplicado a un ejemplo del mundo real. Dispones de un archivo, houses_simple.csv, que contiene información sobre los precios de viviendas junto con su área como característica.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
El siguiente paso es asignar variables y visualizar el conjunto de datos:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
En el ejemplo con la altura de una persona, era mucho más sencillo imaginar una línea que se ajustara bien a los datos.
Sin embargo, ahora nuestros datos presentan mucha más variabilidad, ya que el objetivo depende en gran medida de otros factores como la edad, la ubicación, el interior, etc.
De todas formas, la tarea consiste en construir la línea que mejor se ajuste a los datos disponibles; esto mostrará la tendencia. Para ello, se debe utilizar la clase OLS. Pronto aprenderemos cómo añadir más características, lo que mejorará la predicción.
Swipe to start coding
- Asignar la columna
'price'dedfay. - Crear la matriz
X_tildeutilizando la funciónadd_constant()destatsmodels(importada comosm). - Inicializar el objeto
OLSy entrenarlo. - Preprocesar el arreglo
X_newde la misma manera queX. - Predecir el objetivo para la matriz
X_new_tilde.
Solución
¡Gracias por tus comentarios!
single