Зміст курсу
Теорія ймовірностей
Теорія ймовірностей
Нормальний розподіл
Привіт! Настав час переходити до більш складних дистрибутивів! Перший - безперервний!
Що це?
Неперервний розподіл - це розподіл, який має нескінченну кількість можливих результатів. Тому ми не можемо обчислити значення інтервалу або створити таблицю, оскільки не знаємо їх кількості. Такі розподіли можна виразити лише за допомогою графіка.
Почнемо з найпоширенішого і найзрозумілішого, нормального розподілу!
Для роботи з цим розподілом ми повинні імпортувати об'єкт norm
з scipy.stats
, після чого ми можемо застосувати до цього розподілу численні функції, такі як sf
, cdf
, але не pmf
. Ось функція з таким самим значенням, але з назвою pdf
.
Приклади:
- Розмір тварини.
- Зріст людей.
- Вага при народженні.
Щоб зрозуміти ключові характеристики, краще спочатку подивитися на графік.
Розподіл висоти імператорських пінгвінів у метрах.
Пояснення до графіка:
Гадаю, ви пам'ятаєте щось про середнє значення та стандартне відхилення, тому подивіться на середнє значення, яке тут дорівнює 1,2 метри, та стандартне відхилення зі значенням 0,3. Ви можете побачити найяскравіший жовтий прямокутник зі значенням mean + std (стандартне відхилення) в якості правої межі і mean - std (стандартне відхилення) в якості лівої межі. Важливо, щоб усі значення знаходилися в діапазоні від зазначеної вище суми до 68,3% від усіх значень. Число 68,3% можна назвати довірчим інтервалом.
Значення між середнє + 2 * std і середнє - 2 * std становлять 95,4% всіх значень.
Значення між середнє + 3 * std та середнє - 3 * std становлять 99,7% всіх значень.
Довірчий інтервал:
У нашому випадку з середнім значенням 1,2 і стандартним відхиленням 0,3 ми можемо сказати, що з довірчою ймовірністю 68,3% можна стверджувати, що середній зріст імператорського пінгвіна знаходиться між 1,2 - 0,3 метрів і 1,2 + 0,3 метрів -> 0,9 і 1,5 метрів. З довірчою ймовірністю 95,4% можна стверджувати, що середня висота імператорського пінгвіна знаходиться між 1,2 - 2 * 0,3 метра і 1,2 + 2 * 0,3 метра -> 0,6 і 1,8 метра. З упевненістю 99,7% можна сказати, що середня висота імператорського пінгвіна знаходиться між 1,2 - 3 * 0,3 метрів і 1,2 + 3 * 0,3 метрів -> 0,3 і 2,1 метрів.
Згадаймо деякі функції, трохи для нормального розподілу (вони трохи відрізняються):
Для виведення випадкової вибірки: norm.rvs(loc, scale, size)
.
Для обчислення ймовірності отримання рівно x
подій: norm.pdf(x, loc, scale)
.
Для обчислення ймовірності отримання x
або більше подій: norm.sf(x, loc, scale)
.
Для обчислення ймовірності отримання x
або менше подій: norm.cdf(x, loc, scale)
.
loc
- це середнє значення розподілу.scale
- значення стандартне відхилення розподілу.size
- кількість вибірок розподілу.x
- кількість очікуваних результатів.
Let's recall some functions, bit for normal distribution (they are a little bit different):
For outputting random sample: norm.rvs(loc, scale, size)
.
For calculating the probability of receiving exactly x
events: norm.pdf(x, loc, scale)
.
For calculating the probability of receiving x
or more events: norm.sf(x, loc, scale)
.
For calculating the probability of receiving x
or less events: norm.cdf(x, loc, scale)
.
loc
is the mean value of the distribution.scale
is the standard deviation value of the distribution.size
is the number of samples of the distribution.x
is the number of expected results.
Завдання
Побудуйте випадковий розподіл ваг кота! Дійте за алгоритмом:
- Імпортуйте об'єкт
norm
з файлуscipy.stats
. - Імпортуйте
matplotlib.pyplot
з псевдонімомplt
. - Імпортувати
seaborn
з псевдонімомns
. - Згенерувати випадковий нормальний розподіл з атрибутами:
- Медіана дорівнює
4.2
. - Середньоквадратичне відхилення дорівнює
1
.
- Медіана дорівнює
- Створіть гістограму з такими параметрами:
- Змінна
dist
до атрибутуdata
. - Змінна
True
до атрибутуkde
.
- Змінна
- Вивести графік.
Дякуємо за ваш відгук!
Нормальний розподіл
Привіт! Настав час переходити до більш складних дистрибутивів! Перший - безперервний!
Що це?
Неперервний розподіл - це розподіл, який має нескінченну кількість можливих результатів. Тому ми не можемо обчислити значення інтервалу або створити таблицю, оскільки не знаємо їх кількості. Такі розподіли можна виразити лише за допомогою графіка.
Почнемо з найпоширенішого і найзрозумілішого, нормального розподілу!
Для роботи з цим розподілом ми повинні імпортувати об'єкт norm
з scipy.stats
, після чого ми можемо застосувати до цього розподілу численні функції, такі як sf
, cdf
, але не pmf
. Ось функція з таким самим значенням, але з назвою pdf
.
Приклади:
- Розмір тварини.
- Зріст людей.
- Вага при народженні.
Щоб зрозуміти ключові характеристики, краще спочатку подивитися на графік.
Розподіл висоти імператорських пінгвінів у метрах.
Пояснення до графіка:
Гадаю, ви пам'ятаєте щось про середнє значення та стандартне відхилення, тому подивіться на середнє значення, яке тут дорівнює 1,2 метри, та стандартне відхилення зі значенням 0,3. Ви можете побачити найяскравіший жовтий прямокутник зі значенням mean + std (стандартне відхилення) в якості правої межі і mean - std (стандартне відхилення) в якості лівої межі. Важливо, щоб усі значення знаходилися в діапазоні від зазначеної вище суми до 68,3% від усіх значень. Число 68,3% можна назвати довірчим інтервалом.
Значення між середнє + 2 * std і середнє - 2 * std становлять 95,4% всіх значень.
Значення між середнє + 3 * std та середнє - 3 * std становлять 99,7% всіх значень.
Довірчий інтервал:
У нашому випадку з середнім значенням 1,2 і стандартним відхиленням 0,3 ми можемо сказати, що з довірчою ймовірністю 68,3% можна стверджувати, що середній зріст імператорського пінгвіна знаходиться між 1,2 - 0,3 метрів і 1,2 + 0,3 метрів -> 0,9 і 1,5 метрів. З довірчою ймовірністю 95,4% можна стверджувати, що середня висота імператорського пінгвіна знаходиться між 1,2 - 2 * 0,3 метра і 1,2 + 2 * 0,3 метра -> 0,6 і 1,8 метра. З упевненістю 99,7% можна сказати, що середня висота імператорського пінгвіна знаходиться між 1,2 - 3 * 0,3 метрів і 1,2 + 3 * 0,3 метрів -> 0,3 і 2,1 метрів.
Згадаймо деякі функції, трохи для нормального розподілу (вони трохи відрізняються):
Для виведення випадкової вибірки: norm.rvs(loc, scale, size)
.
Для обчислення ймовірності отримання рівно x
подій: norm.pdf(x, loc, scale)
.
Для обчислення ймовірності отримання x
або більше подій: norm.sf(x, loc, scale)
.
Для обчислення ймовірності отримання x
або менше подій: norm.cdf(x, loc, scale)
.
loc
- це середнє значення розподілу.scale
- значення стандартне відхилення розподілу.size
- кількість вибірок розподілу.x
- кількість очікуваних результатів.
Let's recall some functions, bit for normal distribution (they are a little bit different):
For outputting random sample: norm.rvs(loc, scale, size)
.
For calculating the probability of receiving exactly x
events: norm.pdf(x, loc, scale)
.
For calculating the probability of receiving x
or more events: norm.sf(x, loc, scale)
.
For calculating the probability of receiving x
or less events: norm.cdf(x, loc, scale)
.
loc
is the mean value of the distribution.scale
is the standard deviation value of the distribution.size
is the number of samples of the distribution.x
is the number of expected results.
Завдання
Побудуйте випадковий розподіл ваг кота! Дійте за алгоритмом:
- Імпортуйте об'єкт
norm
з файлуscipy.stats
. - Імпортуйте
matplotlib.pyplot
з псевдонімомplt
. - Імпортувати
seaborn
з псевдонімомns
. - Згенерувати випадковий нормальний розподіл з атрибутами:
- Медіана дорівнює
4.2
. - Середньоквадратичне відхилення дорівнює
1
.
- Медіана дорівнює
- Створіть гістограму з такими параметрами:
- Змінна
dist
до атрибутуdata
. - Змінна
True
до атрибутуkde
.
- Змінна
- Вивести графік.
Дякуємо за ваш відгук!
Нормальний розподіл
Привіт! Настав час переходити до більш складних дистрибутивів! Перший - безперервний!
Що це?
Неперервний розподіл - це розподіл, який має нескінченну кількість можливих результатів. Тому ми не можемо обчислити значення інтервалу або створити таблицю, оскільки не знаємо їх кількості. Такі розподіли можна виразити лише за допомогою графіка.
Почнемо з найпоширенішого і найзрозумілішого, нормального розподілу!
Для роботи з цим розподілом ми повинні імпортувати об'єкт norm
з scipy.stats
, після чого ми можемо застосувати до цього розподілу численні функції, такі як sf
, cdf
, але не pmf
. Ось функція з таким самим значенням, але з назвою pdf
.
Приклади:
- Розмір тварини.
- Зріст людей.
- Вага при народженні.
Щоб зрозуміти ключові характеристики, краще спочатку подивитися на графік.
Розподіл висоти імператорських пінгвінів у метрах.
Пояснення до графіка:
Гадаю, ви пам'ятаєте щось про середнє значення та стандартне відхилення, тому подивіться на середнє значення, яке тут дорівнює 1,2 метри, та стандартне відхилення зі значенням 0,3. Ви можете побачити найяскравіший жовтий прямокутник зі значенням mean + std (стандартне відхилення) в якості правої межі і mean - std (стандартне відхилення) в якості лівої межі. Важливо, щоб усі значення знаходилися в діапазоні від зазначеної вище суми до 68,3% від усіх значень. Число 68,3% можна назвати довірчим інтервалом.
Значення між середнє + 2 * std і середнє - 2 * std становлять 95,4% всіх значень.
Значення між середнє + 3 * std та середнє - 3 * std становлять 99,7% всіх значень.
Довірчий інтервал:
У нашому випадку з середнім значенням 1,2 і стандартним відхиленням 0,3 ми можемо сказати, що з довірчою ймовірністю 68,3% можна стверджувати, що середній зріст імператорського пінгвіна знаходиться між 1,2 - 0,3 метрів і 1,2 + 0,3 метрів -> 0,9 і 1,5 метрів. З довірчою ймовірністю 95,4% можна стверджувати, що середня висота імператорського пінгвіна знаходиться між 1,2 - 2 * 0,3 метра і 1,2 + 2 * 0,3 метра -> 0,6 і 1,8 метра. З упевненістю 99,7% можна сказати, що середня висота імператорського пінгвіна знаходиться між 1,2 - 3 * 0,3 метрів і 1,2 + 3 * 0,3 метрів -> 0,3 і 2,1 метрів.
Згадаймо деякі функції, трохи для нормального розподілу (вони трохи відрізняються):
Для виведення випадкової вибірки: norm.rvs(loc, scale, size)
.
Для обчислення ймовірності отримання рівно x
подій: norm.pdf(x, loc, scale)
.
Для обчислення ймовірності отримання x
або більше подій: norm.sf(x, loc, scale)
.
Для обчислення ймовірності отримання x
або менше подій: norm.cdf(x, loc, scale)
.
loc
- це середнє значення розподілу.scale
- значення стандартне відхилення розподілу.size
- кількість вибірок розподілу.x
- кількість очікуваних результатів.
Let's recall some functions, bit for normal distribution (they are a little bit different):
For outputting random sample: norm.rvs(loc, scale, size)
.
For calculating the probability of receiving exactly x
events: norm.pdf(x, loc, scale)
.
For calculating the probability of receiving x
or more events: norm.sf(x, loc, scale)
.
For calculating the probability of receiving x
or less events: norm.cdf(x, loc, scale)
.
loc
is the mean value of the distribution.scale
is the standard deviation value of the distribution.size
is the number of samples of the distribution.x
is the number of expected results.
Завдання
Побудуйте випадковий розподіл ваг кота! Дійте за алгоритмом:
- Імпортуйте об'єкт
norm
з файлуscipy.stats
. - Імпортуйте
matplotlib.pyplot
з псевдонімомplt
. - Імпортувати
seaborn
з псевдонімомns
. - Згенерувати випадковий нормальний розподіл з атрибутами:
- Медіана дорівнює
4.2
. - Середньоквадратичне відхилення дорівнює
1
.
- Медіана дорівнює
- Створіть гістограму з такими параметрами:
- Змінна
dist
до атрибутуdata
. - Змінна
True
до атрибутуkde
.
- Змінна
- Вивести графік.
Дякуємо за ваш відгук!
Привіт! Настав час переходити до більш складних дистрибутивів! Перший - безперервний!
Що це?
Неперервний розподіл - це розподіл, який має нескінченну кількість можливих результатів. Тому ми не можемо обчислити значення інтервалу або створити таблицю, оскільки не знаємо їх кількості. Такі розподіли можна виразити лише за допомогою графіка.
Почнемо з найпоширенішого і найзрозумілішого, нормального розподілу!
Для роботи з цим розподілом ми повинні імпортувати об'єкт norm
з scipy.stats
, після чого ми можемо застосувати до цього розподілу численні функції, такі як sf
, cdf
, але не pmf
. Ось функція з таким самим значенням, але з назвою pdf
.
Приклади:
- Розмір тварини.
- Зріст людей.
- Вага при народженні.
Щоб зрозуміти ключові характеристики, краще спочатку подивитися на графік.
Розподіл висоти імператорських пінгвінів у метрах.
Пояснення до графіка:
Гадаю, ви пам'ятаєте щось про середнє значення та стандартне відхилення, тому подивіться на середнє значення, яке тут дорівнює 1,2 метри, та стандартне відхилення зі значенням 0,3. Ви можете побачити найяскравіший жовтий прямокутник зі значенням mean + std (стандартне відхилення) в якості правої межі і mean - std (стандартне відхилення) в якості лівої межі. Важливо, щоб усі значення знаходилися в діапазоні від зазначеної вище суми до 68,3% від усіх значень. Число 68,3% можна назвати довірчим інтервалом.
Значення між середнє + 2 * std і середнє - 2 * std становлять 95,4% всіх значень.
Значення між середнє + 3 * std та середнє - 3 * std становлять 99,7% всіх значень.
Довірчий інтервал:
У нашому випадку з середнім значенням 1,2 і стандартним відхиленням 0,3 ми можемо сказати, що з довірчою ймовірністю 68,3% можна стверджувати, що середній зріст імператорського пінгвіна знаходиться між 1,2 - 0,3 метрів і 1,2 + 0,3 метрів -> 0,9 і 1,5 метрів. З довірчою ймовірністю 95,4% можна стверджувати, що середня висота імператорського пінгвіна знаходиться між 1,2 - 2 * 0,3 метра і 1,2 + 2 * 0,3 метра -> 0,6 і 1,8 метра. З упевненістю 99,7% можна сказати, що середня висота імператорського пінгвіна знаходиться між 1,2 - 3 * 0,3 метрів і 1,2 + 3 * 0,3 метрів -> 0,3 і 2,1 метрів.
Згадаймо деякі функції, трохи для нормального розподілу (вони трохи відрізняються):
Для виведення випадкової вибірки: norm.rvs(loc, scale, size)
.
Для обчислення ймовірності отримання рівно x
подій: norm.pdf(x, loc, scale)
.
Для обчислення ймовірності отримання x
або більше подій: norm.sf(x, loc, scale)
.
Для обчислення ймовірності отримання x
або менше подій: norm.cdf(x, loc, scale)
.
loc
- це середнє значення розподілу.scale
- значення стандартне відхилення розподілу.size
- кількість вибірок розподілу.x
- кількість очікуваних результатів.
Let's recall some functions, bit for normal distribution (they are a little bit different):
For outputting random sample: norm.rvs(loc, scale, size)
.
For calculating the probability of receiving exactly x
events: norm.pdf(x, loc, scale)
.
For calculating the probability of receiving x
or more events: norm.sf(x, loc, scale)
.
For calculating the probability of receiving x
or less events: norm.cdf(x, loc, scale)
.
loc
is the mean value of the distribution.scale
is the standard deviation value of the distribution.size
is the number of samples of the distribution.x
is the number of expected results.
Завдання
Побудуйте випадковий розподіл ваг кота! Дійте за алгоритмом:
- Імпортуйте об'єкт
norm
з файлуscipy.stats
. - Імпортуйте
matplotlib.pyplot
з псевдонімомplt
. - Імпортувати
seaborn
з псевдонімомns
. - Згенерувати випадковий нормальний розподіл з атрибутами:
- Медіана дорівнює
4.2
. - Середньоквадратичне відхилення дорівнює
1
.
- Медіана дорівнює
- Створіть гістограму з такими параметрами:
- Змінна
dist
до атрибутуdata
. - Змінна
True
до атрибутуkde
.
- Змінна
- Вивести графік.