Моделі
Основи попередньої обробки даних і побудови конвеєра вже розглянуто. Наступний етап — моделювання.
Модель у Scikit-learn — це естіматор, який надає методи .predict() і .score(), а також успадковує .fit() від усіх естіматорів.
.fit()
Після попередньої обробки даних і підготовки їх до моделі першим кроком побудови моделі є навчання моделі. Це виконується за допомогою .fit(X, y).
Для контрольованого навчання (регресія, класифікація) .fit() вимагає як X, так і y.
Для неконтрольованого навчання (наприклад, кластеризація) викликається лише .fit(X). Передача y не викликає помилки — цей параметр просто ігнорується.
Під час навчання модель засвоює закономірності, необхідні для прогнозування. Те, що саме засвоюється, і тривалість навчання залежать від алгоритму. Навчання часто є найповільнішою частиною машинного навчання, особливо при роботі з великими наборами даних.
.predict()
Після навчання використовуйте .predict() для отримання прогнозів:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() оцінює навчальну модель, зазвичай на тестовій вибірці:
model.fit(X, y)
model.score(X_test, y_test)
Відбувається порівняння прогнозів із реальними цільовими значеннями. За замовчуванням метрикою є точність для задач класифікації.
X_test — це підмножина датасету, відома як тестова вибірка, яка використовується для оцінки якості моделі після навчання. Вона містить ознаки (вхідні дані). y_test — відповідна підмножина істинних міток для X_test. Разом вони дозволяють оцінити, наскільки добре модель прогнозує нові, невідомі дані.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
What are some common algorithms used for modeling in Scikit-learn?
Can you explain the difference between `.fit()`, `.predict()`, and `.score()` in more detail?
How do I choose which metric to use for evaluating my model?
Awesome!
Completion rate improved to 3.13
Моделі
Свайпніть щоб показати меню
Основи попередньої обробки даних і побудови конвеєра вже розглянуто. Наступний етап — моделювання.
Модель у Scikit-learn — це естіматор, який надає методи .predict() і .score(), а також успадковує .fit() від усіх естіматорів.
.fit()
Після попередньої обробки даних і підготовки їх до моделі першим кроком побудови моделі є навчання моделі. Це виконується за допомогою .fit(X, y).
Для контрольованого навчання (регресія, класифікація) .fit() вимагає як X, так і y.
Для неконтрольованого навчання (наприклад, кластеризація) викликається лише .fit(X). Передача y не викликає помилки — цей параметр просто ігнорується.
Під час навчання модель засвоює закономірності, необхідні для прогнозування. Те, що саме засвоюється, і тривалість навчання залежать від алгоритму. Навчання часто є найповільнішою частиною машинного навчання, особливо при роботі з великими наборами даних.
.predict()
Після навчання використовуйте .predict() для отримання прогнозів:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() оцінює навчальну модель, зазвичай на тестовій вибірці:
model.fit(X, y)
model.score(X_test, y_test)
Відбувається порівняння прогнозів із реальними цільовими значеннями. За замовчуванням метрикою є точність для задач класифікації.
X_test — це підмножина датасету, відома як тестова вибірка, яка використовується для оцінки якості моделі після навчання. Вона містить ознаки (вхідні дані). y_test — відповідна підмножина істинних міток для X_test. Разом вони дозволяють оцінити, наскільки добре модель прогнозує нові, невідомі дані.
Дякуємо за ваш відгук!