single
Udfordring: Forudsigelse af Huspriser
Stryg for at vise menuen
Du skal nu opbygge en regressionsmodel baseret på et virkeligt eksempel. Du har en fil, houses_simple.csv, der indeholder information om boligpriser med areal som en egenskab.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Næste trin er at tildele variabler og visualisere datasættet:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
I eksemplet med en persons højde var det meget lettere at forestille sig en linje, der passer godt til dataene.
Men nu har vores data meget mere variation, da målet i høj grad afhænger af mange andre faktorer som alder, beliggenhed, indretning osv.
Opgaven er dog stadig at konstruere den linje, der bedst passer til de data, vi har; den vil vise tendensen. Klassen OLS skal anvendes til dette formål. Snart lærer vi, hvordan vi kan tilføje flere funktioner, hvilket vil forbedre forudsigelsen!
Swipe to start coding
- Tildel kolonnen
'price'fradftily. - Opret matricen
X_tildeved hjælp af funktionenadd_constant()frastatsmodels(importeret somsm). - Initialiser
OLS-objektet og træn det. - Forbehandl arrayet
X_newpå samme måde somX. - Forudsig målet for matricen
X_new_tilde.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat