Kursinhalt
Klassifikation mit Python
Klassifikation mit Python
Was Ist Ein Entscheidungsbaum
Für viele Probleme im echten Leben können wir einen Entscheidungsbaum erstellen. In einem Entscheidungsbaum stellen wir eine Frage (Entscheidungsknoten), und basierend auf der Antwort treffen wir entweder eine Entscheidung (Blattknoten) oder stellen weitere Fragen (Entscheidungsknoten) und so weiter.
Hier ist das Beispiel für einen Enten-/Nicht-Enten-Test.
Es stellt sich heraus, dass wir, wenn wir die gleiche Logik auf die Trainingsdaten anwenden, einen der wichtigsten Algorithmen des maschinellen Lernens erhalten, der sowohl für Regression als auch für Klassifikation verwendet werden kann. In diesem Kurs konzentrieren wir uns auf die Klassifikation. Das folgende Video zeigt, wie es funktioniert.
Hinweis
Im obigen Video zeigt 'Klassen' die Anzahl der Instanzen (auch Proben genannt) jeder Klasse an einem Knoten. Zum Beispiel hält der Wurzelknoten alle Instanzen (4 'Kekse', 4 'keine Kekse'). Und der Blattknoten links hat nur 3 'keine Kekse'.
Mit jedem Entscheidungsnode versuchen wir, die Trainingsdaten so zu teilen, dass die Datenpunkte jeder Klasse in ihre eigenen Blattknoten getrennt werden.
Ein Entscheidungsbaum kann auch problemlos Mehrklassenklassifikationen handhaben:
Und die Klassifikation mit mehreren Merkmalen kann auch vom Entscheidungsbaum gehandhabt werden. Jetzt kann jeder Entscheidungsnode die Daten mit Hilfe eines der Merkmale teilen. Hier ist ein Video mit einem Beispiel:
Hinweis
Im obigen Video wird der Trainingssatz mit
StandardScaler
skaliert. Es ist nicht notwendig für den Entscheidungsbaum. Er wird genauso gut mit den unskalierten Daten funktionieren. Aber das Skalieren verbessert die Leistung aller anderen Algorithmen, daher ist es eine gute Idee, das Skalieren immer in Ihre Vorverarbeitung einzubeziehen.
Danke für Ihr Feedback!