Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Виклик | Статистичні Тести
Вивчення Статистики з Використанням Python
course content

Зміст курсу

Вивчення Статистики з Використанням Python

Вивчення Статистики з Використанням Python

1. Основні Поняття
2. Середнє, Медіана та Мода в Python
3. Дисперсія та Стандартне Відхилення
4. Коваріація та Кореляція
5. Довірчий Інтервал
6. Статистичні Тести

Виклик

Компанія хоче визначити, чи є значна різниця у рівнях продуктивності розробників, які працюють з дому, порівняно з тими, хто працює в офісі. Добре, що ви вже знаєте, що t-критерій може з цим допомогти.

Компанія має дві незалежні команди розробників: одна працює віддалено, а друга працює з офісу. Вам надано два файли, 'work_from_home.csv' та 'work_from_office.csv', які містять дані щодо кількості завдань, виконаних кожним розробником щомісяця.

Ваше завдання полягає у проведенні t-тесту. Компанія хоче знати, чи є розробники, які працюють у офісі, продуктивнішими, ніж працівники на дому. Якщо так, то вони також змусять другу команду працювати в офісі. У разі, якщо працівники на дому будуть продуктивніші, компанія не буде вносити жодних змін. Отже, бажана альтернативна гіпотеза звучить так: "Середня продуктивність працівників офісу є вищою, ніж у працівників на дому."

Давайте перевіримо, чи варіанти однакові:

1234567
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
copy

Друге стандартне відхилення в два рази більше ніж перше, тому дисперсії відрізняються. Згадайте функцію ttest_ind, щоб виконати t-тест.

Завдання

  1. Імпортуйте scipy.stats, використовуючи псевдонім st.
  2. Проведіть t-тест із наступними параметрами:
    • Вибірки: home_workers, office_workers;
    • Альтернативна гіпотеза: офіс > дім;
    • Відсутність однорідності дисперсій.

Завдання

  1. Імпортуйте scipy.stats, використовуючи псевдонім st.
  2. Проведіть t-тест із наступними параметрами:
    • Вибірки: home_workers, office_workers;
    • Альтернативна гіпотеза: офіс > дім;
    • Відсутність однорідності дисперсій.
Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів

Все було зрозуміло?

Секція 6. Розділ 7
toggle bottom row

Виклик

Компанія хоче визначити, чи є значна різниця у рівнях продуктивності розробників, які працюють з дому, порівняно з тими, хто працює в офісі. Добре, що ви вже знаєте, що t-критерій може з цим допомогти.

Компанія має дві незалежні команди розробників: одна працює віддалено, а друга працює з офісу. Вам надано два файли, 'work_from_home.csv' та 'work_from_office.csv', які містять дані щодо кількості завдань, виконаних кожним розробником щомісяця.

Ваше завдання полягає у проведенні t-тесту. Компанія хоче знати, чи є розробники, які працюють у офісі, продуктивнішими, ніж працівники на дому. Якщо так, то вони також змусять другу команду працювати в офісі. У разі, якщо працівники на дому будуть продуктивніші, компанія не буде вносити жодних змін. Отже, бажана альтернативна гіпотеза звучить так: "Середня продуктивність працівників офісу є вищою, ніж у працівників на дому."

Давайте перевіримо, чи варіанти однакові:

1234567
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
copy

Друге стандартне відхилення в два рази більше ніж перше, тому дисперсії відрізняються. Згадайте функцію ttest_ind, щоб виконати t-тест.

Завдання

  1. Імпортуйте scipy.stats, використовуючи псевдонім st.
  2. Проведіть t-тест із наступними параметрами:
    • Вибірки: home_workers, office_workers;
    • Альтернативна гіпотеза: офіс > дім;
    • Відсутність однорідності дисперсій.

Завдання

  1. Імпортуйте scipy.stats, використовуючи псевдонім st.
  2. Проведіть t-тест із наступними параметрами:
    • Вибірки: home_workers, office_workers;
    • Альтернативна гіпотеза: офіс > дім;
    • Відсутність однорідності дисперсій.
Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів

Все було зрозуміло?

Секція 6. Розділ 7
toggle bottom row

Виклик

Компанія хоче визначити, чи є значна різниця у рівнях продуктивності розробників, які працюють з дому, порівняно з тими, хто працює в офісі. Добре, що ви вже знаєте, що t-критерій може з цим допомогти.

Компанія має дві незалежні команди розробників: одна працює віддалено, а друга працює з офісу. Вам надано два файли, 'work_from_home.csv' та 'work_from_office.csv', які містять дані щодо кількості завдань, виконаних кожним розробником щомісяця.

Ваше завдання полягає у проведенні t-тесту. Компанія хоче знати, чи є розробники, які працюють у офісі, продуктивнішими, ніж працівники на дому. Якщо так, то вони також змусять другу команду працювати в офісі. У разі, якщо працівники на дому будуть продуктивніші, компанія не буде вносити жодних змін. Отже, бажана альтернативна гіпотеза звучить так: "Середня продуктивність працівників офісу є вищою, ніж у працівників на дому."

Давайте перевіримо, чи варіанти однакові:

1234567
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
copy

Друге стандартне відхилення в два рази більше ніж перше, тому дисперсії відрізняються. Згадайте функцію ttest_ind, щоб виконати t-тест.

Завдання

  1. Імпортуйте scipy.stats, використовуючи псевдонім st.
  2. Проведіть t-тест із наступними параметрами:
    • Вибірки: home_workers, office_workers;
    • Альтернативна гіпотеза: офіс > дім;
    • Відсутність однорідності дисперсій.

Завдання

  1. Імпортуйте scipy.stats, використовуючи псевдонім st.
  2. Проведіть t-тест із наступними параметрами:
    • Вибірки: home_workers, office_workers;
    • Альтернативна гіпотеза: офіс > дім;
    • Відсутність однорідності дисперсій.
Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів

Все було зрозуміло?

Компанія хоче визначити, чи є значна різниця у рівнях продуктивності розробників, які працюють з дому, порівняно з тими, хто працює в офісі. Добре, що ви вже знаєте, що t-критерій може з цим допомогти.

Компанія має дві незалежні команди розробників: одна працює віддалено, а друга працює з офісу. Вам надано два файли, 'work_from_home.csv' та 'work_from_office.csv', які містять дані щодо кількості завдань, виконаних кожним розробником щомісяця.

Ваше завдання полягає у проведенні t-тесту. Компанія хоче знати, чи є розробники, які працюють у офісі, продуктивнішими, ніж працівники на дому. Якщо так, то вони також змусять другу команду працювати в офісі. У разі, якщо працівники на дому будуть продуктивніші, компанія не буде вносити жодних змін. Отже, бажана альтернативна гіпотеза звучить так: "Середня продуктивність працівників офісу є вищою, ніж у працівників на дому."

Давайте перевіримо, чи варіанти однакові:

1234567
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
copy

Друге стандартне відхилення в два рази більше ніж перше, тому дисперсії відрізняються. Згадайте функцію ttest_ind, щоб виконати t-тест.

Завдання

  1. Імпортуйте scipy.stats, використовуючи псевдонім st.
  2. Проведіть t-тест із наступними параметрами:
    • Вибірки: home_workers, office_workers;
    • Альтернативна гіпотеза: офіс > дім;
    • Відсутність однорідності дисперсій.
Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Секція 6. Розділ 7
Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
We're sorry to hear that something went wrong. What happened?
some-alt