Kursinhalt
Lernen von Statistik mit Python
Lernen von Statistik mit Python
Einen t-Test Durchführen
Ein Unternehmen möchte feststellen, ob es einen signifikanten Unterschied in den Produktivitätsniveaus von Entwicklern gibt, die von zu Hause aus arbeiten, im Vergleich zu denen, die im Büro arbeiten. Gut, dass Sie bereits wissen, dass ein t-Test dabei helfen kann.
Das Unternehmen hat zwei unabhängige Entwicklerteams: eines arbeitet remote und das andere arbeitet vom Büro aus. Ihnen wurden zwei Dateien zur Verfügung gestellt, 'work_from_home.csv'
und 'work_from_office.csv'
, die die monatlichen Aufgabenabschlüsse für jeden Entwickler enthalten.
Ihre Aufgabe ist es, einen t-Test durchzuführen. Das Unternehmen möchte wissen, ob Entwickler, die vom Büro aus arbeiten, produktiver sind als Heimarbeiter. Falls ja, wird das zweite Team ebenfalls gezwungen, vom Büro aus zu arbeiten. Falls Heimarbeiter produktiver sind, wird das Unternehmen keine Änderungen vornehmen. Die gewünschte alternative Hypothese lautet also: "Die durchschnittliche Produktivität der Büroarbeiter ist größer als die der Heimarbeiter."
Lassen Sie uns überprüfen, ob die Varianzen gleich sind:
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
Die zweite Standardabweichung ist doppelt so groß wie die erste, daher unterscheiden sich die Varianzen.
Erinnern Sie sich an die Funktion ttest_ind
, um einen t-Test durchzuführen.
Swipe to start coding
- Importieren Sie
scipy.stats
mit dem Aliasst
. - Führen Sie einen t-Test mit folgendem Setup durch:
- Stichproben:
home_workers
,office_workers
; - Alternative Hypothese: office > home;
- Keine Homogenität der Varianzen.
- Stichproben:
Lösung
Danke für Ihr Feedback!
Einen t-Test Durchführen
Ein Unternehmen möchte feststellen, ob es einen signifikanten Unterschied in den Produktivitätsniveaus von Entwicklern gibt, die von zu Hause aus arbeiten, im Vergleich zu denen, die im Büro arbeiten. Gut, dass Sie bereits wissen, dass ein t-Test dabei helfen kann.
Das Unternehmen hat zwei unabhängige Entwicklerteams: eines arbeitet remote und das andere arbeitet vom Büro aus. Ihnen wurden zwei Dateien zur Verfügung gestellt, 'work_from_home.csv'
und 'work_from_office.csv'
, die die monatlichen Aufgabenabschlüsse für jeden Entwickler enthalten.
Ihre Aufgabe ist es, einen t-Test durchzuführen. Das Unternehmen möchte wissen, ob Entwickler, die vom Büro aus arbeiten, produktiver sind als Heimarbeiter. Falls ja, wird das zweite Team ebenfalls gezwungen, vom Büro aus zu arbeiten. Falls Heimarbeiter produktiver sind, wird das Unternehmen keine Änderungen vornehmen. Die gewünschte alternative Hypothese lautet also: "Die durchschnittliche Produktivität der Büroarbeiter ist größer als die der Heimarbeiter."
Lassen Sie uns überprüfen, ob die Varianzen gleich sind:
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
Die zweite Standardabweichung ist doppelt so groß wie die erste, daher unterscheiden sich die Varianzen.
Erinnern Sie sich an die Funktion ttest_ind
, um einen t-Test durchzuführen.
Swipe to start coding
- Importieren Sie
scipy.stats
mit dem Aliasst
. - Führen Sie einen t-Test mit folgendem Setup durch:
- Stichproben:
home_workers
,office_workers
; - Alternative Hypothese: office > home;
- Keine Homogenität der Varianzen.
- Stichproben:
Lösung
Danke für Ihr Feedback!