Зміст курсу
Вивчення Статистики з Використанням Python
Вивчення Статистики з Використанням Python
Парний t-критерій
Наступна функція проводить парний t-тест:
Цей процес схожий на той, що використовується для незалежних вибірок, але тут нам не потрібно перевіряти однорідність дисперсій. Парний t-тест явно не передбачає, що дисперсії рівні.
Майте на увазі, що для парного t-тесту критично важливо, щоб розміри вибірок були рівні.
З огляду на цю інформацію, ви можете приступити до завдання проведення парного t-критерія Стьюдента.
Тут у вас є дані щодо кількості завантажень певного додатку. Розгляньте зразки: середні значення майже ідентичні.
import pandas as pd import matplotlib.pyplot as plt # Read the data before = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/before.csv').squeeze() after = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/after.csv').squeeze() # Plot histograms plt.hist(before, alpha=0.7) plt.hist(after, alpha=0.7) # Plot the means plt.axvline(before.mean(), color='blue', linestyle='dashed') plt.axvline(after.mean(), color='gold', linestyle='dashed')
Swipe to show code editor
Ми встановлюємо гіпотези:
- H₀: Середня кількість завантажень до та після змін залишається незмінною.
- Hₐ: Середня кількість завантажень після модифікацій є більшою.
Проведіть парний t-критерій з цією альтернативною гіпотезою, використовуючи before
та after
як вибірки.
Дякуємо за ваш відгук!
Парний t-критерій
Наступна функція проводить парний t-тест:
Цей процес схожий на той, що використовується для незалежних вибірок, але тут нам не потрібно перевіряти однорідність дисперсій. Парний t-тест явно не передбачає, що дисперсії рівні.
Майте на увазі, що для парного t-тесту критично важливо, щоб розміри вибірок були рівні.
З огляду на цю інформацію, ви можете приступити до завдання проведення парного t-критерія Стьюдента.
Тут у вас є дані щодо кількості завантажень певного додатку. Розгляньте зразки: середні значення майже ідентичні.
import pandas as pd import matplotlib.pyplot as plt # Read the data before = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/before.csv').squeeze() after = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/after.csv').squeeze() # Plot histograms plt.hist(before, alpha=0.7) plt.hist(after, alpha=0.7) # Plot the means plt.axvline(before.mean(), color='blue', linestyle='dashed') plt.axvline(after.mean(), color='gold', linestyle='dashed')
Swipe to show code editor
Ми встановлюємо гіпотези:
- H₀: Середня кількість завантажень до та після змін залишається незмінною.
- Hₐ: Середня кількість завантажень після модифікацій є більшою.
Проведіть парний t-критерій з цією альтернативною гіпотезою, використовуючи before
та after
як вибірки.
Дякуємо за ваш відгук!