Een t-toets Uitvoeren
Een bedrijf wil vaststellen of er een significant verschil is in het productiviteitsniveau van ontwikkelaars die thuiswerken versus degenen die op kantoor werken. Gelukkig weet je al dat een t-toets hierbij kan helpen.
Het bedrijf heeft twee onafhankelijke ontwikkelteams: één werkt op afstand en het andere werkt vanuit kantoor. Je hebt twee bestanden ontvangen, 'work_from_home.csv'
en 'work_from_office.csv'
, die het maandelijkse aantal voltooide taken per ontwikkelaar bevatten.
De opdracht is om een t-toets uit te voeren. Het bedrijf wil weten of ontwikkelaars die op kantoor werken productiever zijn dan thuiswerkers. Indien dit het geval is, zal het tweede team ook verplicht worden op kantoor te werken. Als thuiswerkers productiever blijken, zal het bedrijf geen wijzigingen doorvoeren. De gewenste alternatieve hypothese is dus: "De gemiddelde productiviteit van kantoormedewerkers is groter dan die van thuiswerkers".
Laten we controleren of de varianties gelijk zijn:
1234567import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
De tweede standaardafwijking is twee keer zo groot als de eerste, dus de varianties verschillen.
Herinner de functie ttest_ind
om een t-toets uit te voeren.
st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Swipe to start coding
Je vergelijkt de productiviteit van werknemers die thuis werken met die van werknemers die op kantoor werken. Het doel is om vast te stellen of kantoormedewerkers een hogere gemiddelde productiviteit hebben dan thuiswerkers met behulp van een t-toets voor onafhankelijke steekproeven.
- Importeer de bibliotheek
scipy.stats
met het aliasst
. - Gebruik de functie
st.ttest_ind()
om de t-toets uit te voeren met de volgende instellingen:
- Steekproeven:
office_workers
,home_workers
. - Alternatieve hypothese: office > home.
- Varianten zijn niet gelijk (
equal_var=False
).
- Sla de resultaten op in de variabelen
tstat
enpvalue
. - Print, op basis van de
pvalue
, een van de volgende berichten:
"We support the null hypothesis, the mean values are equal"
alspvalue > 0.05
."We reject the null hypothesis, the mean values are different"
anders.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Can you show me how to perform the t-test with unequal variances?
What should the parameters be for the t-test given our alternative hypothesis?
What does the result of the t-test mean for the company's decision?
Awesome!
Completion rate improved to 2.63
Een t-toets Uitvoeren
Veeg om het menu te tonen
Een bedrijf wil vaststellen of er een significant verschil is in het productiviteitsniveau van ontwikkelaars die thuiswerken versus degenen die op kantoor werken. Gelukkig weet je al dat een t-toets hierbij kan helpen.
Het bedrijf heeft twee onafhankelijke ontwikkelteams: één werkt op afstand en het andere werkt vanuit kantoor. Je hebt twee bestanden ontvangen, 'work_from_home.csv'
en 'work_from_office.csv'
, die het maandelijkse aantal voltooide taken per ontwikkelaar bevatten.
De opdracht is om een t-toets uit te voeren. Het bedrijf wil weten of ontwikkelaars die op kantoor werken productiever zijn dan thuiswerkers. Indien dit het geval is, zal het tweede team ook verplicht worden op kantoor te werken. Als thuiswerkers productiever blijken, zal het bedrijf geen wijzigingen doorvoeren. De gewenste alternatieve hypothese is dus: "De gemiddelde productiviteit van kantoormedewerkers is groter dan die van thuiswerkers".
Laten we controleren of de varianties gelijk zijn:
1234567import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
De tweede standaardafwijking is twee keer zo groot als de eerste, dus de varianties verschillen.
Herinner de functie ttest_ind
om een t-toets uit te voeren.
st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Swipe to start coding
Je vergelijkt de productiviteit van werknemers die thuis werken met die van werknemers die op kantoor werken. Het doel is om vast te stellen of kantoormedewerkers een hogere gemiddelde productiviteit hebben dan thuiswerkers met behulp van een t-toets voor onafhankelijke steekproeven.
- Importeer de bibliotheek
scipy.stats
met het aliasst
. - Gebruik de functie
st.ttest_ind()
om de t-toets uit te voeren met de volgende instellingen:
- Steekproeven:
office_workers
,home_workers
. - Alternatieve hypothese: office > home.
- Varianten zijn niet gelijk (
equal_var=False
).
- Sla de resultaten op in de variabelen
tstat
enpvalue
. - Print, op basis van de
pvalue
, een van de volgende berichten:
"We support the null hypothesis, the mean values are equal"
alspvalue > 0.05
."We reject the null hypothesis, the mean values are different"
anders.
Oplossing
Bedankt voor je feedback!
single