Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Interactiekenmerken Creëren | Feature Engineering voor Machine Learning
Data Preprocessing en Feature Engineering

bookInteractiekenmerken Creëren

Note
Definitie

Interactiekenmerken zijn nieuwe variabelen die worden gevormd door twee of meer bestaande kenmerken te combineren, vaak via wiskundige bewerkingen zoals vermenigvuldiging, deling of optelling, om weer te geven hoe deze variabelen gezamenlijk het doel beïnvloeden.

Het creëren van interactiekenmerken maakt het mogelijk om complexe relaties tussen variabelen in de Titanic-dataset vast te leggen, zoals Age, Fare, Pclass en Sex. De invloed van één variabele op overleving kan afhangen van de waarde van een andere variabele. Bijvoorbeeld, het effect van passagiersklasse op overleving kan verschillen voor mannen en vrouwen, of jongere passagiers kunnen meer profiteren van hogere tarieven. Door kenmerken te combineren zoals Age * Fare of Pclass * Sex_encoded, stelt u uw model in staat om deze genuanceerde patronen te leren, waardoor het vermogen om te voorspellen wie overleefde op basis van interacties tussen variabelen wordt verbeterd.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Welke van de volgende opties illustreert het beste een nuttig interactiekenmerk in de Titanic-dataset, zoals het combineren van Age * Fare of Pclass * Sex_encoded om relaties tussen variabelen vast te leggen?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 2

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 8.33

bookInteractiekenmerken Creëren

Veeg om het menu te tonen

Note
Definitie

Interactiekenmerken zijn nieuwe variabelen die worden gevormd door twee of meer bestaande kenmerken te combineren, vaak via wiskundige bewerkingen zoals vermenigvuldiging, deling of optelling, om weer te geven hoe deze variabelen gezamenlijk het doel beïnvloeden.

Het creëren van interactiekenmerken maakt het mogelijk om complexe relaties tussen variabelen in de Titanic-dataset vast te leggen, zoals Age, Fare, Pclass en Sex. De invloed van één variabele op overleving kan afhangen van de waarde van een andere variabele. Bijvoorbeeld, het effect van passagiersklasse op overleving kan verschillen voor mannen en vrouwen, of jongere passagiers kunnen meer profiteren van hogere tarieven. Door kenmerken te combineren zoals Age * Fare of Pclass * Sex_encoded, stelt u uw model in staat om deze genuanceerde patronen te leren, waardoor het vermogen om te voorspellen wie overleefde op basis van interacties tussen variabelen wordt verbeterd.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Welke van de volgende opties illustreert het beste een nuttig interactiekenmerk in de Titanic-dataset, zoals het combineren van Age * Fare of Pclass * Sex_encoded om relaties tussen variabelen vast te leggen?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 2
some-alt