Lernen Verwendung von Ensembles als Basismodelle | Häufig Verwendete Stacking-Modelle

Die Verwendung von Ensemble-Modellen als Basismodelle innerhalb eines Stacking-Ensemble-Frameworks ist ein anspruchsvoller Ansatz im maschinellen Lernen, der mehrere Vor- und Nachteile bietet. Hier gehen wir auf die Details dieser Methode ein.

Vorteile der Verwendung von Ensembles als Basismodelle in Stacking-Ensembles:

Verbesserte Vorhersageleistung: Ensemble-Modelle wie Random Forests, Gradient Boosting oder AdaBoost sind bekannt für ihre Fähigkeit, die Vorhersagegenauigkeit zu verbessern. Durch die Integration von Ensemble-Modellen als Basislerner kann Stacking die kollektive Vorhersagekraft dieser Modelle nutzen, was oft zu einer überlegenen Leistung im Vergleich zu einzelnen Modellen führt;
Vielfältige Modellierungsansätze: Ensembles bringen Vielfalt in die Basismodelle eines Stacking-Ensembles ein. Verschiedene Ensemble-Techniken haben unterschiedliche Stärken und Schwächen. Ihre Kombination erweitert die Bandbreite der eingesetzten Modellierungsansätze und macht das Ensemble besser geeignet, mit unterschiedlichen Datenmustern und -komplexitäten umzugehen;
Robustheit gegen Overfitting: Stacking mit Ensemble-Modellen kann Overfitting mindern. Ensembles sind hervorragend darin, die Auswirkungen von Rauschen oder Ausreißern in den Daten zu reduzieren, wodurch die Fähigkeit des Stacking-Ensembles verbessert wird, gut auf unbekannte Daten zu verallgemeinern.

Nachteile der Verwendung von Ensembles als Basismodelle in Stacking-Ensembles:

Erhöhte Modellkomplexität: Der Einsatz von Ensemble-Modellen als Basislerner erhöht die Komplexität des Stacking-Ensembles. Die Verwaltung mehrerer Ensemble-Modelle erfordert eine sorgfältige Überlegung hinsichtlich der Hyperparameter-Abstimmung, der Trainingszeiten und der Rechenressourcen;
Rechenaufwand: Ensembles, insbesondere tiefe oder große Ensembles, können rechnerisch intensiv zu trainieren und zu bewerten sein. Dies kann zu längeren Trainingszeiten führen und möglicherweise nicht für Echtzeit- oder ressourcenbeschränkte Anwendungen geeignet sein;
Interpretierbarkeitsbedenken: Ensembles, insbesondere tiefe Ensembles, werden häufig als weniger interpretierbar angesehen als einzelne Modelle. Diese reduzierte Interpretierbarkeit kann das Verständnis von Modellvorhersagen behindern und möglicherweise den Nutzen des Modells in bestimmten Bereichen einschränken, in denen Interpretierbarkeit entscheidend ist.

Beispiel

Wir werden das 'steel-plates-fault'-Datenset verwenden und versuchen, einen Stacking-Klassifikator mit Ensembles als Basismodelle zu erstellen:


              123456789101112131415161718192021222324252627282930313233343536373839
            
from sklearn.datasets import fetch_openml
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier, AdaBoostClassifier
from sklearn.neural_network import MLPClassifier
from sklearn.ensemble import StackingClassifier
from sklearn.metrics import f1_score
import warnings
warnings.filterwarnings('ignore')

# Step 1: Load the dataset using fetch_openml
dataset = fetch_openml("steel-plates-fault", version=1)

# Extract features (X) and target variable (y)
X = dataset.data
y = dataset.target

# Step 2: Split the data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Step 3: Create base models
rf_model = RandomForestClassifier(n_estimators=100, random_state=42)
ada_model = AdaBoostClassifier(n_estimators=50, random_state=42)

# Step 4: Create the meta model (neural network)
meta_model = MLPClassifier(hidden_layer_sizes=(100, 50), max_iter=500)

# Step 5: Create the stacking classifier
base_models = [('rf', rf_model), ('ada', ada_model)]
stacking_classifier = StackingClassifier(estimators=base_models, final_estimator=meta_model)

# Step 6: Train the stacking classifier
stacking_classifier.fit(X_train, y_train)

# Step 7: Make predictions
y_pred = stacking_classifier.predict(X_test)

# Step 8: Evaluate the results using F1 score
f1 = f1_score(y_test, y_pred, average='weighted')
print('F1 Score:', f1)

War alles klar?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 4

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Swipe um das Menü anzuzeigen