Contenu du cours
Apprendre les Statistiques avec Python
Apprendre les Statistiques avec Python
Effectuer un Test t
Une entreprise veut déterminer s'il existe une différence significative dans les niveaux de productivité des développeurs qui travaillent à domicile par rapport à ceux qui travaillent au bureau. Heureusement, vous savez déjà qu'un test t peut aider avec cela.
L'entreprise a deux équipes de développeurs indépendantes : l'une travaille à distance et l'autre travaille depuis le bureau. On vous a fourni deux fichiers, 'work_from_home.csv'
et 'work_from_office.csv'
, qui contiennent les comptes mensuels de tâches accomplies pour chaque développeur.
Votre tâche est de réaliser un test t. L'entreprise veut savoir si les développeurs qui travaillent au bureau sont plus productifs que ceux qui travaillent à domicile. Si c'est le cas, ils obligeront également la deuxième équipe à travailler au bureau. Dans le cas où les travailleurs à domicile sont plus productifs, l'entreprise ne fera aucun changement. Ainsi, l'hypothèse alternative souhaitée est "La productivité moyenne des travailleurs de bureau est supérieure à celle des travailleurs à domicile."
Vérifions si les variances sont les mêmes :
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
La deuxième déviation standard est deux fois plus grande que la première, donc les variances diffèrent.
Rappelez-vous de la fonction ttest_ind
pour effectuer un test t.
Swipe to start coding
- Importez
scipy.stats
en utilisant l'aliasst
. - Effectuez un test t avec la configuration suivante :
- Échantillons :
home_workers
,office_workers
; - Hypothèse alternative : office > home;
- Pas d'homogénéité des variances.
- Échantillons :
Solution
Merci pour vos commentaires !
Effectuer un Test t
Une entreprise veut déterminer s'il existe une différence significative dans les niveaux de productivité des développeurs qui travaillent à domicile par rapport à ceux qui travaillent au bureau. Heureusement, vous savez déjà qu'un test t peut aider avec cela.
L'entreprise a deux équipes de développeurs indépendantes : l'une travaille à distance et l'autre travaille depuis le bureau. On vous a fourni deux fichiers, 'work_from_home.csv'
et 'work_from_office.csv'
, qui contiennent les comptes mensuels de tâches accomplies pour chaque développeur.
Votre tâche est de réaliser un test t. L'entreprise veut savoir si les développeurs qui travaillent au bureau sont plus productifs que ceux qui travaillent à domicile. Si c'est le cas, ils obligeront également la deuxième équipe à travailler au bureau. Dans le cas où les travailleurs à domicile sont plus productifs, l'entreprise ne fera aucun changement. Ainsi, l'hypothèse alternative souhaitée est "La productivité moyenne des travailleurs de bureau est supérieure à celle des travailleurs à domicile."
Vérifions si les variances sont les mêmes :
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
La deuxième déviation standard est deux fois plus grande que la première, donc les variances diffèrent.
Rappelez-vous de la fonction ttest_ind
pour effectuer un test t.
Swipe to start coding
- Importez
scipy.stats
en utilisant l'aliasst
. - Effectuez un test t avec la configuration suivante :
- Échantillons :
home_workers
,office_workers
; - Hypothèse alternative : office > home;
- Pas d'homogénéité des variances.
- Échantillons :
Solution
Merci pour vos commentaires !