Зміст курсу
Вивчення Статистики з Використанням Python
Вивчення Статистики з Використанням Python
Проведення t-тесту в Python
Щоб провести t-тест у Python, все, що вам потрібно зробити, це вказати альтернативну гіпотезу і вказати, чи є дисперсії приблизно рівними (однорідними).
Функція ttest_ind()
у файлі scipy.stats
зробить все інше. Нижче наведено синтаксис:
Параметри:
a
- перша вибірка.b
- друга вибірка.equal_var
- встановлюється вTrue
, якщо дисперсії приблизно рівні, і вFalse
, якщо ні.alternative
- тип альтернативної гіпотези:'two-sided'
- вказує на те, що середні не рівні.'less'
- означає, що перше середнє менше за друге.'greater'
- означає, що перше середнє більше за друге.
Значення, що повертаються:
statistic
- значення t-статистики.pvalue
- p-значення.
Нас цікавить pvalue
. Якщо воно менше α (зазвичай 0,05), то t-статистика знаходиться в критичній області, тому ми повинні прийняти альтернативну гіпотезу. Якщо ж pvalue
більше α - приймаємо нульову гіпотезу про рівність середніх.
Ось приклад застосування t-тесту до нашого набору даних про зріст:
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
Дякуємо за ваш відгук!