Kursinhalt
Fortgeschrittene Wahrscheinlichkeitstheorie
Fortgeschrittene Wahrscheinlichkeitstheorie
Was Ist Eine Statistische Hypothese? Fehler 1. und 2. Art
Statistische Hypothese H ist eine Annahme über die Art der Verteilung der Grundgesamtheit, die anhand der verfügbaren Stichproben getestet wird. Wenn die Verteilung der Grundgesamtheit bekannt ist und es notwendig ist, die Annahme bezüglich der Werte der Verteilungsparameter anhand der Stichproben zu überprüfen, werden solche Hypothesen als parametrisch bezeichnet.
Die Hypothese, die wir direkt bestätigen oder widerlegen möchten, wird als Haupthypothese (auch Nullhypothese genannt) bezeichnet, die restlichen Hypothesen sind alternativ. Schauen wir uns ein Beispiel zur besseren Verständigung an.
Beispiel 1
Angenommen, es gibt Stichproben, und wir möchten überprüfen, ob sie nach dem Gaußschen Gesetz verteilt sind. In diesem Fall können die Haupt- und Alternativhypothesen folgendermaßen aussehen:
Haupthypothese: Stichproben haben eine Gaußsche Verteilung.
Alternativhypothese: Stichproben haben eine andere Verteilung.
Beispiel 2
Angenommen, wir wissen, dass die Daten gaußförmig sind. Wir haben den Mittelwert geschätzt, und die Schätzung beträgt 3.98
. Wir möchten überprüfen, ob der tatsächliche Mittelwert 3.98
oder größer ist. In diesem Fall lauten die Hypothesen:
Haupthypothese: Der tatsächliche Mittelwert der Population ist gleich 3.98
.
Alternativhypothese: Der tatsächliche Mittelwert der Population ist größer als 3.98
.
Was ist ein statistisches Kriterium
Kriterium ist eine Regel, die verwendet wird, um Hypothesen anzunehmen oder abzulehnen, in der Regel ist es eine Funktion, die Stichproben als Argumente hat. Anhand des Wertes dieser Funktion bestimmen wir, ob die Haupthypothese wahr ist oder nicht.
Wenn der Funktionswert in einen bestimmten Bereich S fällt, lehnen wir die Hauptannahme ab, ein solcher Bereich S wird als kritisch bezeichnet.
Fehler 1. und 2. Art
Wir definieren den kritischen Bereich anhand der statistischen Eigenschaften unseres Kriteriums. Dazu müssen wir die folgenden zwei Konzepte einführen:
- Fehler 1. Art (α-Fehler) ist ein falsch-positiver Fehler, der auftritt, wenn wir die Nullhypothese ablehnen, obwohl sie wahr ist. Er repräsentiert die Wahrscheinlichkeit, eine wahre Nullhypothese abzulehnen. Das Signifikanzniveau (α) ist die Wahrscheinlichkeit, einen Fehler 1. Art zu begehen;
- Fehler 2. Art (β-Fehler) ist ein falsch-negativer Fehler, der auftritt, wenn wir die Nullhypothese akzeptieren, obwohl sie falsch ist. Er repräsentiert die Wahrscheinlichkeit, eine falsche Nullhypothese nicht abzulehnen. Die Teststärke (1-β) ist die Wahrscheinlichkeit, eine falsche Nullhypothese korrekt abzulehnen.
In der Praxis wählen wir oft manuell ein Signifikanzniveau, das den kritischen Bereich unseres Tests bestimmt. Der kritische Wert trennt den Ablehnungsbereich (die Enden der Verteilung) vom Nicht-Ablehnungsbereich basierend auf dem gewählten Signifikanzniveau.
Beispiel
Zum Beispiel, nehmen wir an, wir testen eine Hypothese mit normalverteilten Kriteriumswerten. Wenn wir das Signifikanzniveau auf 0.05
setzen, wird der kritische Bereich entsprechend bestimmt.
Wenn der Kriteriumswert in den Ablehnungsbereich fällt, betrachten wir die Nullhypothese als abgelehnt. In diesem Fall testen wir die rechtshändige Hypothese; dementsprechend befindet sich der kritische Bereich rechts. Wenn die Alternativhypothese wie folgt formuliert wurde: Der tatsächliche Populationsmittelwert ist kleiner als 3,98, hätten wir eine andere linkshändige Hypothese und einen anderen kritischen Bereich:
Es gibt auch zweiseitige kritische Bereiche, in denen die Ablehnungsbereiche der Haupthypothese sowohl rechts als auch links liegen.
Danke für Ihr Feedback!