Зміст курсу

Основи Комп'ютерного Зору

1. Вступ до Комп'ютерного Зору

Що таке комп'ютерний зір?Основи Обробки Зображень Лінійна Алгебра для Обробки Зображень

2. Обробка Зображень з OpenCV

Базові Перетворення Перетворення Фур'є Низькочастотні та Високочастотні Фільтри Зменшення Шуму та Згладжування Вирівнювання Гістограми Техніки Суперроздільної Здатності Виявлення Країв Виявлення Кутів і Плям

3. Згорткові Нейронні Мережі

Вступ до Згорткових Нейронних Мереж Шари Згортки Шари Підвибірки Перетворення у вектор Функції активації Огляд популярних моделей CNN Завдання: Побудова CNN

4. Виявлення Об'єктів

Локалізація Об'єктів Виявлення Об'єктів Прогнозування Обмежувальних Рамок Перетин над Об'єднанням (IoU) та Метрики Оцінювання Приглушення Немаксимальних Значень (NMS)Якорні блоки Огляд Моделі YOLO Завдання: Виявлення Об'єктів Із Власною Моделлю Та YOLO

5. Огляд Розширених Тем

Трансферне навчання у комп'ютерному зорі Огляд Розпізнавання Обличчя Огляд Генерації Зображень

Функції активації

Чому функції активації є ключовими в згорткових нейронних мережах

Функції активації вводять нелінійність у згорткові нейронні мережі (CNN), дозволяючи їм навчатися складним шаблонам, які недоступні для простих лінійних моделей. Без функцій активації CNN були б неспроможні виявляти складні взаємозв'язки в даних, що обмежує їхню ефективність у розпізнаванні та класифікації зображень. Вибір відповідної функції активації впливає на швидкість навчання, стабільність і загальну продуктивність.

Поширені функції активації

ReLU (rectified linear unit): найпоширеніша функція активації в CNN. Пропускає лише додатні значення, встановлюючи всі від’ємні входи в нуль, що забезпечує обчислювальну ефективність і запобігає зникненню градієнтів. Однак деякі нейрони можуть стати неактивними через проблему "вимираючого ReLU";

f (x) = max (0, x)

Leaky ReLU: варіація ReLU, яка допускає невеликі від’ємні значення замість встановлення їх у нуль, запобігаючи неактивним нейронам і покращуючи потік градієнта;

f (x) = {\begin{cases} x & , x > 0 \\ α x & , x \leq 0 \end{cases}

Sigmoid: стискає вхідні значення в діапазон від 0 до 1, що робить її корисною для бінарної класифікації. Однак у глибоких мережах виникає проблема зникнення градієнтів;

f (x) = \frac{1}{1 + e^{- x}}

Tanh: подібна до Sigmoid, але повертає значення в діапазоні від -1 до 1, центровані навколо нуля;

f (x) = \frac{e^{x} - e^{- x}}{e^{x} + e^{- x}}

Softmax: зазвичай використовується на фінальному шарі для багатокласової класифікації; Softmax перетворює сирі вихідні дані мережі на ймовірності, забезпечуючи їхню суму до одиниці для кращої інтерпретованості.

f (x_{i}) = \frac{e^{x_{i}}}{\sum_{j}^{} e^{x_{j}}}

Вибір відповідної функції активації

ReLU є типовим вибором для прихованих шарів завдяки своїй ефективності та високій продуктивності, тоді як Leaky ReLU краще підходить у випадках неактивності нейронів. Sigmoid та Tanh зазвичай уникають у глибоких CNN, але вони можуть бути корисними для окремих застосувань. Softmax залишається необхідною для задач багатокласової класифікації, забезпечуючи чіткі ймовірнісні передбачення.

Вибір правильної функції активації є ключовим для оптимізації продуктивності CNN, балансу ефективності та запобігання таким проблемам, як зникнення або вибух градієнтів. Кожна функція унікально впливає на те, як мережа обробляє та навчається на візуальних даних.

1. Чому ReLU віддають перевагу над Sigmoid у глибоких згорткових нейронних мережах?

2. Яку функцію активації зазвичай використовують на фінальному шарі багатокласової згорткової нейронної мережі?

3. Яка основна перевага Leaky ReLU над стандартним ReLU?

Чому ReLU віддають перевагу над Sigmoid у глибоких згорткових нейронних мережах?

Select the correct answer

ReLU краще запобігає перенавчанню, ніж Sigmoid.

ReLU може працювати з багатокласовою класифікацією.

ReLU уникає зникнення градієнтів і пришвидшує навчання.

Sigmoid є обчислювально ефективнішим.

Яку функцію активації зазвичай використовують на фінальному шарі багатокласової згорткової нейронної мережі?

Select the correct answer

ReLU

Tanh

Leaky ReLU

Softmax

Яка основна перевага Leaky ReLU над стандартним ReLU?

Select the correct answer

Він усуває потребу у Softmax-шарі.

Він запобігає неактивності нейронів, дозволяючи невеликі від’ємні виходи.

Він нормалізує значення в діапазоні від -1 до 1.

Він забезпечує, що всі нейрони мають додатні виходи.

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 5

Запитати АІ

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Зміст курсу

Основи Комп'ютерного Зору

1. Вступ до Комп'ютерного Зору

Що таке комп'ютерний зір?Основи Обробки Зображень Лінійна Алгебра для Обробки Зображень

2. Обробка Зображень з OpenCV

3. Згорткові Нейронні Мережі

4. Виявлення Об'єктів

5. Огляд Розширених Тем

Трансферне навчання у комп'ютерному зорі Огляд Розпізнавання Обличчя Огляд Генерації Зображень

Функції активації

Чому функції активації є ключовими в згорткових нейронних мережах

Поширені функції активації

ReLU (rectified linear unit): найпоширеніша функція активації в CNN. Пропускає лише додатні значення, встановлюючи всі від’ємні входи в нуль, що забезпечує обчислювальну ефективність і запобігає зникненню градієнтів. Однак деякі нейрони можуть стати неактивними через проблему "вимираючого ReLU";

f (x) = max (0, x)

Leaky ReLU: варіація ReLU, яка допускає невеликі від’ємні значення замість встановлення їх у нуль, запобігаючи неактивним нейронам і покращуючи потік градієнта;

f (x) = {\begin{cases} x & , x > 0 \\ α x & , x \leq 0 \end{cases}

Sigmoid: стискає вхідні значення в діапазон від 0 до 1, що робить її корисною для бінарної класифікації. Однак у глибоких мережах виникає проблема зникнення градієнтів;

f (x) = \frac{1}{1 + e^{- x}}

Tanh: подібна до Sigmoid, але повертає значення в діапазоні від -1 до 1, центровані навколо нуля;

f (x) = \frac{e^{x} - e^{- x}}{e^{x} + e^{- x}}

Softmax: зазвичай використовується на фінальному шарі для багатокласової класифікації; Softmax перетворює сирі вихідні дані мережі на ймовірності, забезпечуючи їхню суму до одиниці для кращої інтерпретованості.

f (x_{i}) = \frac{e^{x_{i}}}{\sum_{j}^{} e^{x_{j}}}

Вибір відповідної функції активації

1. Чому ReLU віддають перевагу над Sigmoid у глибоких згорткових нейронних мережах?

2. Яку функцію активації зазвичай використовують на фінальному шарі багатокласової згорткової нейронної мережі?

3. Яка основна перевага Leaky ReLU над стандартним ReLU?

Чому ReLU віддають перевагу над Sigmoid у глибоких згорткових нейронних мережах?

Select the correct answer

ReLU краще запобігає перенавчанню, ніж Sigmoid.

ReLU може працювати з багатокласовою класифікацією.

ReLU уникає зникнення градієнтів і пришвидшує навчання.

Sigmoid є обчислювально ефективнішим.

Select the correct answer

ReLU

Tanh

Leaky ReLU

Softmax

Яка основна перевага Leaky ReLU над стандартним ReLU?

Select the correct answer

Він усуває потребу у Softmax-шарі.

Він запобігає неактивності нейронів, дозволяючи невеликі від’ємні виходи.

Він нормалізує значення в діапазоні від -1 до 1.

Він забезпечує, що всі нейрони мають додатні виходи.

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 5