Kursinhalt
Fortgeschrittene Wahrscheinlichkeitstheorie
Fortgeschrittene Wahrscheinlichkeitstheorie
Herausforderung: Verwendung des CLT zum Vergleich von Mittelwerten Nicht-Gaußscher Datensätze
Im letzten Kapitel haben wir betrachtet, wie man die mathematischen Erwartungen von zwei Gaußschen Datensätzen vergleichen kann. Aber was, wenn die Datensätze nicht Gaußsch sind, und ist es in diesem Fall möglich, sie irgendwie zu vergleichen?
Verwendung des Zentralen Grenzwertsatzes zum Vergleich von Mittelwerten
Wir können den ZGS verwenden, um Mittelwerte von nicht-Gaußschen Datensätzen zu vergleichen:
- Wenn wir viele Stichproben haben, können wir den ZGS nutzen, um neue Merkmale zu konstruieren: Anstatt Stichproben zu analysieren, können wir die Mittelwerte der Stichproben analysieren. Aufgrund des ZGS wird dieser Mittelwert, wenn wir ihn mit vielen Stichproben berechnen, normalverteilt sein;
- Verwenden Sie das im vorherigen Kapitel beschriebene Student-Kriterium, um die Hypothese zu testen.
Hinweis
Für verschiedene Verteilungen müssen Sie eine unterschiedliche Anzahl von Stichproben auswählen, für die der Durchschnitt berechnet wird, um Normalität zu erreichen. Dies wird normalerweise experimentell mit verschiedenen Tests auf Normalität durchgeführt, zum Beispiel dem
shapiro
-Normalitätstest.
Swipe to start coding
Jetzt werden wir die Hypothese überprüfen, dass zwei exponentielle Datensätze gleiche Mittelwerte haben, indem wir den zentralen Grenzwertsatz verwenden. Ihre Aufgabe ist:
- Importieren Sie die Funktion
ttest_ind
aus dem Modulscipy.stats
, um den t-Test bereitzustellen. - Verwenden Sie die Methode
.mean()
, um den Mittelwert über das gleitende Fenster in der Funktionsliding_mean
zu berechnen. - Verwenden Sie die Funktion
shapiro()
, um die Normalität des ArraysX_mean
zu überprüfen. - Geben Sie die Bedingung in der
if
-Anweisung an, um die Hypothese zu überprüfen.
Lösung
Danke für Ihr Feedback!
Herausforderung: Verwendung des CLT zum Vergleich von Mittelwerten Nicht-Gaußscher Datensätze
Im letzten Kapitel haben wir betrachtet, wie man die mathematischen Erwartungen von zwei Gaußschen Datensätzen vergleichen kann. Aber was, wenn die Datensätze nicht Gaußsch sind, und ist es in diesem Fall möglich, sie irgendwie zu vergleichen?
Verwendung des Zentralen Grenzwertsatzes zum Vergleich von Mittelwerten
Wir können den ZGS verwenden, um Mittelwerte von nicht-Gaußschen Datensätzen zu vergleichen:
- Wenn wir viele Stichproben haben, können wir den ZGS nutzen, um neue Merkmale zu konstruieren: Anstatt Stichproben zu analysieren, können wir die Mittelwerte der Stichproben analysieren. Aufgrund des ZGS wird dieser Mittelwert, wenn wir ihn mit vielen Stichproben berechnen, normalverteilt sein;
- Verwenden Sie das im vorherigen Kapitel beschriebene Student-Kriterium, um die Hypothese zu testen.
Hinweis
Für verschiedene Verteilungen müssen Sie eine unterschiedliche Anzahl von Stichproben auswählen, für die der Durchschnitt berechnet wird, um Normalität zu erreichen. Dies wird normalerweise experimentell mit verschiedenen Tests auf Normalität durchgeführt, zum Beispiel dem
shapiro
-Normalitätstest.
Swipe to start coding
Jetzt werden wir die Hypothese überprüfen, dass zwei exponentielle Datensätze gleiche Mittelwerte haben, indem wir den zentralen Grenzwertsatz verwenden. Ihre Aufgabe ist:
- Importieren Sie die Funktion
ttest_ind
aus dem Modulscipy.stats
, um den t-Test bereitzustellen. - Verwenden Sie die Methode
.mean()
, um den Mittelwert über das gleitende Fenster in der Funktionsliding_mean
zu berechnen. - Verwenden Sie die Funktion
shapiro()
, um die Normalität des ArraysX_mean
zu überprüfen. - Geben Sie die Bedingung in der
if
-Anweisung an, um die Hypothese zu überprüfen.
Lösung
Danke für Ihr Feedback!