Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Yhteisvaikutusominaisuuksien Luominen | Piirteiden Suunnittelu Koneoppimista Varten
Datan Esikäsittely ja Ominaisuuksien Rakentaminen

bookYhteisvaikutusominaisuuksien Luominen

Note
Määritelmä

Interaktiopiirteet ovat uusia muuttujia, jotka muodostetaan yhdistämällä kaksi tai useampia olemassa olevia piirteitä, usein matemaattisten operaatioiden, kuten kertolaskun, jakolaskun tai yhteenlaskun avulla, jotta voidaan kuvata, miten nämä muuttujat yhdessä vaikuttavat kohteeseen.

Interaktiopiirteiden luominen mahdollistaa monimutkaisten riippuvuuksien havaitsemisen Titanic-aineiston muuttujien, kuten Age, Fare, Pclass ja Sex, välillä. Yhden muuttujan vaikutus selviytymiseen voi riippua toisen muuttujan arvosta. Esimerkiksi matkustusluokan vaikutus selviytymiseen voi olla erilainen miehillä ja naisilla, tai nuoremmat matkustajat voivat hyötyä enemmän korkeammista lipunhinnoista. Yhdistämällä piirteitä, kuten Age * Fare tai Pclass * Sex_encoded, mahdollistat mallin oppia näitä hienovaraisia yhteyksiä, mikä parantaa sen kykyä ennustaa selviytymistä muuttujien vuorovaikutuksen perusteella.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Mikä seuraavista havainnollistaa parhaiten hyödyllistä interaktio-ominaisuutta Titanic-aineistossa, kuten Age * Fare tai Pclass * Sex_encoded, jotka kuvaavat muuttujien välisiä suhteita?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 2

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain how these interaction features improve model performance?

What other interaction features could be useful for the Titanic dataset?

How do I interpret the values of these new features?

Awesome!

Completion rate improved to 8.33

bookYhteisvaikutusominaisuuksien Luominen

Pyyhkäise näyttääksesi valikon

Note
Määritelmä

Interaktiopiirteet ovat uusia muuttujia, jotka muodostetaan yhdistämällä kaksi tai useampia olemassa olevia piirteitä, usein matemaattisten operaatioiden, kuten kertolaskun, jakolaskun tai yhteenlaskun avulla, jotta voidaan kuvata, miten nämä muuttujat yhdessä vaikuttavat kohteeseen.

Interaktiopiirteiden luominen mahdollistaa monimutkaisten riippuvuuksien havaitsemisen Titanic-aineiston muuttujien, kuten Age, Fare, Pclass ja Sex, välillä. Yhden muuttujan vaikutus selviytymiseen voi riippua toisen muuttujan arvosta. Esimerkiksi matkustusluokan vaikutus selviytymiseen voi olla erilainen miehillä ja naisilla, tai nuoremmat matkustajat voivat hyötyä enemmän korkeammista lipunhinnoista. Yhdistämällä piirteitä, kuten Age * Fare tai Pclass * Sex_encoded, mahdollistat mallin oppia näitä hienovaraisia yhteyksiä, mikä parantaa sen kykyä ennustaa selviytymistä muuttujien vuorovaikutuksen perusteella.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Mikä seuraavista havainnollistaa parhaiten hyödyllistä interaktio-ominaisuutta Titanic-aineistossa, kuten Age * Fare tai Pclass * Sex_encoded, jotka kuvaavat muuttujien välisiä suhteita?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 2
some-alt