Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Gennemfør en t-test | Statistisk Testning
Lær Statistik med Python

bookGennemfør en t-test

En virksomhed ønsker at afgøre, om der er en signifikant forskel i produktivitetsniveauet mellem udviklere, der arbejder hjemmefra, og dem, der arbejder på kontoret. Heldigvis ved du allerede, at en t-test kan hjælpe med dette.

Virksomheden har to uafhængige udviklerteams: det ene arbejder eksternt, og det andet arbejder fra kontoret. Du har fået udleveret to filer, 'work_from_home.csv' og 'work_from_office.csv', som indeholder de månedlige opgaveafslutningstal for hver udvikler.

Opgaven er at udføre en t-test. Virksomheden ønsker at vide, om udviklere, der arbejder fra kontoret, er mere produktive end hjemmearbejdere. Hvis det er tilfældet, vil de også tvinge det andet team til at arbejde fra kontoret. Hvis hjemmearbejderne er mere produktive, vil virksomheden ikke foretage ændringer. Den ønskede alternative hypotese er derfor: "Den gennemsnitlige produktivitet for kontorarbejdere er større end for hjemmearbejdere".

Kontroller om variansen er ens:

1234567
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
copy

Den anden standardafvigelse er dobbelt så stor som den første, så varianserne er forskellige. Husk funktionen ttest_ind til at udføre et t-test.

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Opgave

Swipe to start coding

Du sammenligner produktiviteten hos medarbejdere, der arbejder hjemmefra, med dem, der arbejder på kontoret. Dit mål er at afgøre, om kontormedarbejdere har en højere gennemsnitlig produktivitet end hjemmearbejdere ved hjælp af en t-test for uafhængige stikprøver.

  1. Importér biblioteket scipy.stats med aliaset st.
  2. Brug funktionen st.ttest_ind() til at udføre t-testen med følgende opsætning:
  • Stikprøver: office_workers, home_workers.
  • Alternativ hypotese: office > home.
  • Varianserne er ikke ens (equal_var=False).
  1. Gem resultaterne i variablerne tstat og pvalue.
  2. Baseret på pvalue, udskriv en af følgende beskeder:
  • "We support the null hypothesis, the mean values are equal" hvis pvalue > 0.05.
  • "We reject the null hypothesis, the mean values are different" ellers.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 6. Kapitel 7
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

Awesome!

Completion rate improved to 2.63

bookGennemfør en t-test

Stryg for at vise menuen

En virksomhed ønsker at afgøre, om der er en signifikant forskel i produktivitetsniveauet mellem udviklere, der arbejder hjemmefra, og dem, der arbejder på kontoret. Heldigvis ved du allerede, at en t-test kan hjælpe med dette.

Virksomheden har to uafhængige udviklerteams: det ene arbejder eksternt, og det andet arbejder fra kontoret. Du har fået udleveret to filer, 'work_from_home.csv' og 'work_from_office.csv', som indeholder de månedlige opgaveafslutningstal for hver udvikler.

Opgaven er at udføre en t-test. Virksomheden ønsker at vide, om udviklere, der arbejder fra kontoret, er mere produktive end hjemmearbejdere. Hvis det er tilfældet, vil de også tvinge det andet team til at arbejde fra kontoret. Hvis hjemmearbejderne er mere produktive, vil virksomheden ikke foretage ændringer. Den ønskede alternative hypotese er derfor: "Den gennemsnitlige produktivitet for kontorarbejdere er større end for hjemmearbejdere".

Kontroller om variansen er ens:

1234567
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
copy

Den anden standardafvigelse er dobbelt så stor som den første, så varianserne er forskellige. Husk funktionen ttest_ind til at udføre et t-test.

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Opgave

Swipe to start coding

Du sammenligner produktiviteten hos medarbejdere, der arbejder hjemmefra, med dem, der arbejder på kontoret. Dit mål er at afgøre, om kontormedarbejdere har en højere gennemsnitlig produktivitet end hjemmearbejdere ved hjælp af en t-test for uafhængige stikprøver.

  1. Importér biblioteket scipy.stats med aliaset st.
  2. Brug funktionen st.ttest_ind() til at udføre t-testen med følgende opsætning:
  • Stikprøver: office_workers, home_workers.
  • Alternativ hypotese: office > home.
  • Varianserne er ikke ens (equal_var=False).
  1. Gem resultaterne i variablerne tstat og pvalue.
  2. Baseret på pvalue, udskriv en af følgende beskeder:
  • "We support the null hypothesis, the mean values are equal" hvis pvalue > 0.05.
  • "We reject the null hypothesis, the mean values are different" ellers.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 6. Kapitel 7
single

single

some-alt