Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Skapa Interaktionsfunktioner | Feature Engineering för Maskininlärning
Datapreprocessering och Feature Engineering

bookSkapa Interaktionsfunktioner

Note
Definition

Interaktionsfunktioner är nya variabler som skapas genom att kombinera två eller flera befintliga funktioner, ofta genom matematiska operationer såsom multiplikation, division eller addition, för att återspegla hur dessa variabler gemensamt påverkar målet.

Att skapa interaktionsfunktioner möjliggör att fånga komplexa samband mellan variabler i Titanic-datasetet, såsom Age, Fare, Pclass och Sex. En variabels påverkan på överlevnad kan bero på värdet av en annan variabel. Till exempel kan effekten av passagerarklass på överlevnad skilja sig mellan män och kvinnor, eller så kan yngre passagerare dra större nytta av högre biljettpriser. Genom att kombinera funktioner som Age * Fare eller Pclass * Sex_encoded kan modellen lära sig dessa nyanserade mönster, vilket förbättrar dess förmåga att förutsäga vem som överlevde baserat på hur variabler samverkar.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Vilket av följande illustrerar bäst en användbar interaktionsfunktion i Titanic-datasetet, såsom att kombinera Age * Fare eller Pclass * Sex_encoded för att fånga relationer mellan variabler?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 2

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Suggested prompts:

Can you explain how these interaction features improve model performance?

What other interaction features could be useful for the Titanic dataset?

How do I interpret the values of these new features?

Awesome!

Completion rate improved to 8.33

bookSkapa Interaktionsfunktioner

Svep för att visa menyn

Note
Definition

Interaktionsfunktioner är nya variabler som skapas genom att kombinera två eller flera befintliga funktioner, ofta genom matematiska operationer såsom multiplikation, division eller addition, för att återspegla hur dessa variabler gemensamt påverkar målet.

Att skapa interaktionsfunktioner möjliggör att fånga komplexa samband mellan variabler i Titanic-datasetet, såsom Age, Fare, Pclass och Sex. En variabels påverkan på överlevnad kan bero på värdet av en annan variabel. Till exempel kan effekten av passagerarklass på överlevnad skilja sig mellan män och kvinnor, eller så kan yngre passagerare dra större nytta av högre biljettpriser. Genom att kombinera funktioner som Age * Fare eller Pclass * Sex_encoded kan modellen lära sig dessa nyanserade mönster, vilket förbättrar dess förmåga att förutsäga vem som överlevde baserat på hur variabler samverkar.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Vilket av följande illustrerar bäst en användbar interaktionsfunktion i Titanic-datasetet, såsom att kombinera Age * Fare eller Pclass * Sex_encoded för att fånga relationer mellan variabler?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 2
some-alt