Kursinhalt
Klassifikation mit Python
Klassifikation mit Python
Was Ist Logistische Regression
Obwohl Logistische Regression das Wort "Regression" im Namen hat, was eine andere Aufgabe ist, handelt es sich um den Klassifikationsalgorithmus.
Warum wird es so genannt? Es leitet sich von der linearen Regression ab und wurde modifiziert, um eine Klassifikationsaufgabe anstelle einer Regression durchzuführen. Wie wird das erreicht? Schauen wir uns das Beispiel an!
Hinweis
Dieser Abschnitt enthält Verweise auf eine lineare Regression. Wenn Sie mit der linearen Regression nicht vertraut sind, können Sie unseren Kurs zur linearen Regression mit Python ansehen, obwohl Sie auch ohne das Verständnis aller Verweise zurechtkommen sollten.
Angenommen, Sie möchten vorhersagen, ob eine Person bei einem ersten Kredit in Verzug gerät (keine Kreditgeschichte verfügbar). In der linearen Regression haben wir eine Gleichung erstellt, um numerische Werte vorherzusagen. Wir können dieselbe Gleichung verwenden, um einen "Zuverlässigkeitswert" zu berechnen. Dieser berücksichtigt Merkmale wie Einkommen, Dauer der aktuellen Beschäftigung, Schulden-Einkommens-Verhältnis usw. Ein höherer Zuverlässigkeitswert bedeutet eine geringere Wahrscheinlichkeit eines Zahlungsausfalls.
β sind die Parameter, die der Computer während des Trainings lernen wird. Das nächste Kapitel wird das Lernen der Parameter behandeln. Für den Moment nehmen wir an, dass wir bereits die besten Werte von β haben. Der nächste Schritt wäre, einen Zuverlässigkeitswert für jede Instanz im Trainingssatz zu berechnen und diese zu plotten.
Nun müssen wir diesen Score in Klassen, 0 oder 1, umwandeln. Der Weg der logistischen Regression, dies zu tun, ist die Anwendung einer Sigmoidfunktion. Sie schrumpft die Vorhersagen auf einen Bereich von 0 bis 1.
Nun ist die Vorhersagelinie, die wir erhalten, eine Wahrscheinlichkeit, zur Klasse "1" zu gehören.
Um die Vorhersage in 0 oder 1 anstelle einer Wahrscheinlichkeit umzuwandeln, können wir den Schwellenwert verwenden (normalerweise auf 0,5 gesetzt). Wenn die vorhergesagte Wahrscheinlichkeit höher als der Schwellenwert ist, klassifizieren wir die Instanz als 1, andernfalls als 0.
Wir werden nicht in die mathematischen Details der Wahl der Sigmoidfunktion eintauchen, noch müssen Sie unbedingt ihre Gleichung verstehen. Wenn Sie sich jedoch das Diagramm ansehen, können Sie erkennen, warum es zu unserer Aufgabe passt. Es sagt die Klasse mit hoher Zuverlässigkeit für einen sehr niedrigen oder hohen Zuverlässigkeitswert voraus. Und in der Mitte, wo wir Instanzen aus beiden Klassen haben und uns nicht sicher sein können, sagt es eine Wahrscheinlichkeit von etwa 0,5 voraus, die langsam wächst, wenn das z größer wird.
Das ist also die Idee hinter der logistischen Regression. Offensichtlich kann dieser Ansatz für viele verschiedene Aufgaben verallgemeinert werden, zum Beispiel zur Berechnung eines "Keksigkeits-Scores", um Süßigkeiten als Keks/nicht Keks zu klassifizieren :). Aber damit das Ganze mit der logistischen Regression gut funktioniert, sollten wir die β-Parameter korrekt finden. Das werden Sie im nächsten Kapitel lernen!
Danke für Ihr Feedback!