Kursinhalt
Lineare Regression mit Python
Lineare Regression mit Python
Hauspreise Vorhersagen
Lassen Sie uns ein Regressionsmodell für ein reales Beispiel erstellen. Wir haben eine Datei, houses_simple.csv
, die Informationen über Immobilienpreise mit der Fläche als Merkmal enthält.
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Lassen Sie uns Variablen zuweisen und unser Datenset visualisieren!
import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5)
Im Beispiel mit der Körpergröße einer Person war es viel einfacher, sich eine Linie vorzustellen, die gut zu den Daten passt.
Aber jetzt haben unsere Daten viel mehr Varianz, da das Ziel stark von vielen anderen Dingen wie Alter, Standort, Innenausstattung usw. abhängt.
Dennoch besteht die Aufgabe darin, die Linie zu erstellen, die am besten zu den vorhandenen Daten passt; sie wird den Trend zeigen. Die OLS
-Klasse sollte dafür verwendet werden. Bald werden wir lernen, wie man mehr Merkmale hinzufügt, um die Vorhersage zu verbessern!
Swipe to start coding
- Weisen Sie die
'price'
-Spalte vondf
y
zu. - Erstellen Sie die
X_tilde
-Matrix mit deradd_constant()
-Funktion vonstatsmodels
(importiert alssm
). - Initialisieren Sie das
OLS
-Objekt und trainieren Sie es. - Verarbeiten Sie das
X_new
-Array auf die gleiche Weise wieX
. - Sagen Sie das Ziel für die
X_new_tilde
-Matrix voraus.
Sobald Sie diese Aufgabe abgeschlossen haben, klicken Sie auf die -Schaltfläche unter dem Code, um Ihre Lösung zu überprüfen.
Lösung
Danke für Ihr Feedback!
Hauspreise Vorhersagen
Lassen Sie uns ein Regressionsmodell für ein reales Beispiel erstellen. Wir haben eine Datei, houses_simple.csv
, die Informationen über Immobilienpreise mit der Fläche als Merkmal enthält.
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Lassen Sie uns Variablen zuweisen und unser Datenset visualisieren!
import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5)
Im Beispiel mit der Körpergröße einer Person war es viel einfacher, sich eine Linie vorzustellen, die gut zu den Daten passt.
Aber jetzt haben unsere Daten viel mehr Varianz, da das Ziel stark von vielen anderen Dingen wie Alter, Standort, Innenausstattung usw. abhängt.
Dennoch besteht die Aufgabe darin, die Linie zu erstellen, die am besten zu den vorhandenen Daten passt; sie wird den Trend zeigen. Die OLS
-Klasse sollte dafür verwendet werden. Bald werden wir lernen, wie man mehr Merkmale hinzufügt, um die Vorhersage zu verbessern!
Swipe to start coding
- Weisen Sie die
'price'
-Spalte vondf
y
zu. - Erstellen Sie die
X_tilde
-Matrix mit deradd_constant()
-Funktion vonstatsmodels
(importiert alssm
). - Initialisieren Sie das
OLS
-Objekt und trainieren Sie es. - Verarbeiten Sie das
X_new
-Array auf die gleiche Weise wieX
. - Sagen Sie das Ziel für die
X_new_tilde
-Matrix voraus.
Sobald Sie diese Aufgabe abgeschlossen haben, klicken Sie auf die -Schaltfläche unter dem Code, um Ihre Lösung zu überprüfen.
Lösung
Danke für Ihr Feedback!