Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Creación de Características de Interacción | Ingeniería de Características para Aprendizaje Automático
Preprocesamiento de Datos y Diseño de Características

bookCreación de Características de Interacción

Note
Definición

Las características de interacción son nuevas variables formadas al combinar dos o más características existentes, a menudo mediante operaciones matemáticas como multiplicación, división o suma, para reflejar cómo estas variables influyen conjuntamente en el objetivo.

La creación de características de interacción permite capturar relaciones complejas entre variables en el conjunto de datos del Titanic, como Age, Fare, Pclass y Sex. La influencia de una variable sobre la supervivencia puede depender del valor de otra variable. Por ejemplo, el efecto de la clase del pasajero en la supervivencia puede diferir entre hombres y mujeres, o los pasajeros más jóvenes podrían beneficiarse más de tarifas más altas. Al combinar características como Age * Fare o Pclass * Sex_encoded, se habilita al modelo para aprender estos patrones matizados, mejorando su capacidad para predecir quién sobrevivió en función de cómo interactúan las variables.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

¿Cuál de las siguientes opciones ilustra mejor una característica de interacción útil en el conjunto de datos del Titanic, como combinar Age * Fare o Pclass * Sex_encoded para capturar relaciones entre variables?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 2

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Awesome!

Completion rate improved to 8.33

bookCreación de Características de Interacción

Desliza para mostrar el menú

Note
Definición

Las características de interacción son nuevas variables formadas al combinar dos o más características existentes, a menudo mediante operaciones matemáticas como multiplicación, división o suma, para reflejar cómo estas variables influyen conjuntamente en el objetivo.

La creación de características de interacción permite capturar relaciones complejas entre variables en el conjunto de datos del Titanic, como Age, Fare, Pclass y Sex. La influencia de una variable sobre la supervivencia puede depender del valor de otra variable. Por ejemplo, el efecto de la clase del pasajero en la supervivencia puede diferir entre hombres y mujeres, o los pasajeros más jóvenes podrían beneficiarse más de tarifas más altas. Al combinar características como Age * Fare o Pclass * Sex_encoded, se habilita al modelo para aprender estos patrones matizados, mejorando su capacidad para predecir quién sobrevivió en función de cómo interactúan las variables.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

¿Cuál de las siguientes opciones ilustra mejor una característica de interacción útil en el conjunto de datos del Titanic, como combinar Age * Fare o Pclass * Sex_encoded para capturar relaciones entre variables?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 2
some-alt