Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Création de Caractéristiques d'Interaction | Ingénierie des Caractéristiques pour l'Apprentissage Automatique
Prétraitement des Données et Ingénierie des Variables

bookCréation de Caractéristiques d'Interaction

Note
Définition

Les variables d'interaction sont de nouvelles variables créées en combinant deux ou plusieurs variables existantes, souvent à l'aide d'opérations mathématiques telles que la multiplication, la division ou l'addition, afin de refléter la manière dont ces variables influencent conjointement la cible.

La création de variables d'interaction permet de capturer des relations complexes entre les variables du jeu de données Titanic, telles que Age, Fare, Pclass et Sex. L'influence d'une variable sur la survie peut dépendre de la valeur d'une autre variable. Par exemple, l'effet de la classe du passager sur la survie peut différer selon le sexe, ou les passagers plus jeunes peuvent bénéficier davantage de tarifs plus élevés. En combinant des variables comme Age * Fare ou Pclass * Sex_encoded, le modèle peut apprendre ces schémas nuancés, améliorant ainsi sa capacité à prédire qui a survécu en fonction de l'interaction entre les variables.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Laquelle des propositions suivantes illustre le mieux une caractéristique d'interaction utile dans le jeu de données Titanic, comme la combinaison de Age * Fare ou Pclass * Sex_encoded pour capturer les relations entre variables ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 2

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Awesome!

Completion rate improved to 8.33

bookCréation de Caractéristiques d'Interaction

Glissez pour afficher le menu

Note
Définition

Les variables d'interaction sont de nouvelles variables créées en combinant deux ou plusieurs variables existantes, souvent à l'aide d'opérations mathématiques telles que la multiplication, la division ou l'addition, afin de refléter la manière dont ces variables influencent conjointement la cible.

La création de variables d'interaction permet de capturer des relations complexes entre les variables du jeu de données Titanic, telles que Age, Fare, Pclass et Sex. L'influence d'une variable sur la survie peut dépendre de la valeur d'une autre variable. Par exemple, l'effet de la classe du passager sur la survie peut différer selon le sexe, ou les passagers plus jeunes peuvent bénéficier davantage de tarifs plus élevés. En combinant des variables comme Age * Fare ou Pclass * Sex_encoded, le modèle peut apprendre ces schémas nuancés, améliorant ainsi sa capacité à prédire qui a survécu en fonction de l'interaction entre les variables.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Laquelle des propositions suivantes illustre le mieux une caractéristique d'interaction utile dans le jeu de données Titanic, comme la combinaison de Age * Fare ou Pclass * Sex_encoded pour capturer les relations entre variables ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 2
some-alt