Завдання: Налаштування Гіперпараметрів за Допомогою RandomizedSearchCV
Принцип роботи RandomizedSearchCV подібний до GridSearchCV, але замість перевірки всіх можливих комбінацій, він оцінює лише випадково вибрану підмножину.
Наприклад, наступний param_grid містить 100 комбінацій:
param_grid = {
'n_neighbors': [1, 3, 5, 7, 9, 12, 15, 17, 20, 25],
'weights': ['distance', 'uniform'],
'p': [1, 2, 3, 4, 5]
}
GridSearchCV перевірятиме всі 100, що є тривалим за часом. Натомість RandomizedSearchCV може оцінити меншу підмножину, наприклад, 20 випадково вибраних комбінацій. Це зменшує час обчислень і зазвичай дає результати, близькі до найкращих.
Кількість комбінацій для перевірки визначається аргументом n_iter (за замовчуванням — 10). В іншому використання таке ж, як і у GridSearchCV.
Swipe to start coding
Вам надано попередньо оброблений набір даних про пінгвінів, готовий для навчання моделі.
Ваша мета — налаштувати гіперпараметри моделі KNeighborsClassifier за допомогою методів перебору сітки (grid search) та випадкового пошуку (randomized search).
- Визначте сітку параметрів з назвою
param_gridіз бажаними значеннями дляn_neighbors,weightsтаp. - Ініціалізуйте об'єкт
RandomizedSearchCV, використовуючи визначену сітку параметрів, встановітьn_iter=20. - Ініціалізуйте об'єкт
GridSearchCV, використовуючи ту ж сітку параметрів. - Навчіть обидва об'єкти пошуку на наборі даних за допомогою методу
.fit(X, y). - Виведіть найкращий естіматор із grid search за допомогою
.best_estimator_. - Виведіть найкращий результат крос-валідації з randomized search за допомогою
.best_score_.
Рішення
Можна спробувати запустити код кілька разів. Зверніть увагу на різницю між двома оцінками. Іноді оцінки можуть бути однаковими через наявність найкращих параметрів серед комбінацій, вибраних RandomizedSearchCV.
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain when to use RandomizedSearchCV instead of GridSearchCV?
How do I choose the right value for n_iter in RandomizedSearchCV?
What are the main advantages and disadvantages of RandomizedSearchCV?
Awesome!
Completion rate improved to 3.13
Завдання: Налаштування Гіперпараметрів за Допомогою RandomizedSearchCV
Свайпніть щоб показати меню
Принцип роботи RandomizedSearchCV подібний до GridSearchCV, але замість перевірки всіх можливих комбінацій, він оцінює лише випадково вибрану підмножину.
Наприклад, наступний param_grid містить 100 комбінацій:
param_grid = {
'n_neighbors': [1, 3, 5, 7, 9, 12, 15, 17, 20, 25],
'weights': ['distance', 'uniform'],
'p': [1, 2, 3, 4, 5]
}
GridSearchCV перевірятиме всі 100, що є тривалим за часом. Натомість RandomizedSearchCV може оцінити меншу підмножину, наприклад, 20 випадково вибраних комбінацій. Це зменшує час обчислень і зазвичай дає результати, близькі до найкращих.
Кількість комбінацій для перевірки визначається аргументом n_iter (за замовчуванням — 10). В іншому використання таке ж, як і у GridSearchCV.
Swipe to start coding
Вам надано попередньо оброблений набір даних про пінгвінів, готовий для навчання моделі.
Ваша мета — налаштувати гіперпараметри моделі KNeighborsClassifier за допомогою методів перебору сітки (grid search) та випадкового пошуку (randomized search).
- Визначте сітку параметрів з назвою
param_gridіз бажаними значеннями дляn_neighbors,weightsтаp. - Ініціалізуйте об'єкт
RandomizedSearchCV, використовуючи визначену сітку параметрів, встановітьn_iter=20. - Ініціалізуйте об'єкт
GridSearchCV, використовуючи ту ж сітку параметрів. - Навчіть обидва об'єкти пошуку на наборі даних за допомогою методу
.fit(X, y). - Виведіть найкращий естіматор із grid search за допомогою
.best_estimator_. - Виведіть найкращий результат крос-валідації з randomized search за допомогою
.best_score_.
Рішення
Можна спробувати запустити код кілька разів. Зверніть увагу на різницю між двома оцінками. Іноді оцінки можуть бути однаковими через наявність найкращих параметрів серед комбінацій, вибраних RandomizedSearchCV.
Дякуємо за ваш відгук!
single