Création de Caractéristiques d'Interaction
Les variables d'interaction sont de nouvelles variables créées en combinant deux ou plusieurs variables existantes, souvent à l'aide d'opérations mathématiques telles que la multiplication, la division ou l'addition, afin de refléter la manière dont ces variables influencent conjointement la cible.
La création de variables d'interaction permet de capturer des relations complexes entre les variables du jeu de données Titanic, telles que Age, Fare, Pclass et Sex. L'influence d'une variable sur la survie peut dépendre de la valeur d'une autre variable. Par exemple, l'effet de la classe du passager sur la survie peut différer selon le sexe, ou les passagers plus jeunes peuvent bénéficier davantage de tarifs plus élevés. En combinant des variables comme Age * Fare ou Pclass * Sex_encoded, le modèle peut apprendre ces schémas nuancés, améliorant ainsi sa capacité à prédire qui a survécu en fonction de l'interaction entre les variables.
1234567891011121314151617181920import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 8.33
Création de Caractéristiques d'Interaction
Glissez pour afficher le menu
Les variables d'interaction sont de nouvelles variables créées en combinant deux ou plusieurs variables existantes, souvent à l'aide d'opérations mathématiques telles que la multiplication, la division ou l'addition, afin de refléter la manière dont ces variables influencent conjointement la cible.
La création de variables d'interaction permet de capturer des relations complexes entre les variables du jeu de données Titanic, telles que Age, Fare, Pclass et Sex. L'influence d'une variable sur la survie peut dépendre de la valeur d'une autre variable. Par exemple, l'effet de la classe du passager sur la survie peut différer selon le sexe, ou les passagers plus jeunes peuvent bénéficier davantage de tarifs plus élevés. En combinant des variables comme Age * Fare ou Pclass * Sex_encoded, le modèle peut apprendre ces schémas nuancés, améliorant ainsi sa capacité à prédire qui a survécu en fonction de l'interaction entre les variables.
1234567891011121314151617181920import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
Merci pour vos commentaires !