Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Erstellung von Interaktionsmerkmalen | Feature Engineering für Machine Learning
Datenvorverarbeitung und Feature Engineering

bookErstellung von Interaktionsmerkmalen

Note
Definition

Interaktionsmerkmale sind neue Variablen, die durch die Kombination von zwei oder mehr bestehenden Merkmalen entstehen, häufig durch mathematische Operationen wie Multiplikation, Division oder Addition, um widerzuspiegeln, wie diese Variablen gemeinsam das Ziel beeinflussen.

Die Erstellung von Interaktionsmerkmalen ermöglicht es, komplexe Zusammenhänge zwischen Variablen im Titanic-Datensatz wie Age, Fare, Pclass und Sex zu erfassen. Der Einfluss einer Variablen auf das Überleben kann vom Wert einer anderen Variablen abhängen. Beispielsweise kann sich der Effekt der Passagierklasse auf das Überleben zwischen Männern und Frauen unterscheiden, oder jüngere Passagiere profitieren möglicherweise stärker von höheren Fahrpreisen. Durch die Kombination von Merkmalen wie Age * Fare oder Pclass * Sex_encoded kann das Modell diese differenzierten Muster erkennen und so die Vorhersagegenauigkeit bezüglich des Überlebens verbessern, indem es die Wechselwirkungen zwischen den Variablen berücksichtigt.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Welches der folgenden Beispiele veranschaulicht am besten ein nützliches Interaktionsmerkmal im Titanic-Datensatz, wie die Kombination von Age * Fare oder Pclass * Sex_encoded, um Beziehungen zwischen Variablen zu erfassen?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 2

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Awesome!

Completion rate improved to 8.33

bookErstellung von Interaktionsmerkmalen

Swipe um das Menü anzuzeigen

Note
Definition

Interaktionsmerkmale sind neue Variablen, die durch die Kombination von zwei oder mehr bestehenden Merkmalen entstehen, häufig durch mathematische Operationen wie Multiplikation, Division oder Addition, um widerzuspiegeln, wie diese Variablen gemeinsam das Ziel beeinflussen.

Die Erstellung von Interaktionsmerkmalen ermöglicht es, komplexe Zusammenhänge zwischen Variablen im Titanic-Datensatz wie Age, Fare, Pclass und Sex zu erfassen. Der Einfluss einer Variablen auf das Überleben kann vom Wert einer anderen Variablen abhängen. Beispielsweise kann sich der Effekt der Passagierklasse auf das Überleben zwischen Männern und Frauen unterscheiden, oder jüngere Passagiere profitieren möglicherweise stärker von höheren Fahrpreisen. Durch die Kombination von Merkmalen wie Age * Fare oder Pclass * Sex_encoded kann das Modell diese differenzierten Muster erkennen und so die Vorhersagegenauigkeit bezüglich des Überlebens verbessern, indem es die Wechselwirkungen zwischen den Variablen berücksichtigt.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Welches der folgenden Beispiele veranschaulicht am besten ein nützliches Interaktionsmerkmal im Titanic-Datensatz, wie die Kombination von Age * Fare oder Pclass * Sex_encoded, um Beziehungen zwischen Variablen zu erfassen?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 2
some-alt