Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Моделі | Моделювання
Вступ до машинного навчання з Python

bookМоделі

Основи попередньої обробки даних і побудови конвеєра вже розглянуто. Наступний етап — моделювання.

Модель у Scikit-learn — це естіматор, який надає методи .predict() і .score(), а також успадковує .fit() від усіх естіматорів.

.fit()

Після попередньої обробки даних і підготовки їх до моделі першим кроком побудови моделі є навчання моделі. Це виконується за допомогою .fit(X, y).

Note
Примітка

Для контрольованого навчання (регресія, класифікація) .fit() вимагає як X, так і y. Для неконтрольованого навчання (наприклад, кластеризація) викликається лише .fit(X). Передача y не викликає помилки — цей параметр просто ігнорується.

Під час навчання модель засвоює закономірності, необхідні для прогнозування. Те, що саме засвоюється, і тривалість навчання залежать від алгоритму. Навчання часто є найповільнішою частиною машинного навчання, особливо при роботі з великими наборами даних.

.predict()

Після навчання використовуйте .predict() для отримання прогнозів:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() оцінює навчальну модель, зазвичай на тестовій вибірці:

model.fit(X, y)
model.score(X_test, y_test)

Відбувається порівняння прогнозів із реальними цільовими значеннями. За замовчуванням метрикою є точність для задач класифікації.

Note
Примітка

X_test — це підмножина датасету, відома як тестова вибірка, яка використовується для оцінки якості моделі після навчання. Вона містить ознаки (вхідні дані). y_test — відповідна підмножина істинних міток для X_test. Разом вони дозволяють оцінити, наскільки добре модель прогнозує нові, невідомі дані.

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 1

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

What are some common algorithms used for modeling in Scikit-learn?

Can you explain the difference between `.fit()`, `.predict()`, and `.score()` in more detail?

How do I choose which metric to use for evaluating my model?

Awesome!

Completion rate improved to 3.13

bookМоделі

Свайпніть щоб показати меню

Основи попередньої обробки даних і побудови конвеєра вже розглянуто. Наступний етап — моделювання.

Модель у Scikit-learn — це естіматор, який надає методи .predict() і .score(), а також успадковує .fit() від усіх естіматорів.

.fit()

Після попередньої обробки даних і підготовки їх до моделі першим кроком побудови моделі є навчання моделі. Це виконується за допомогою .fit(X, y).

Note
Примітка

Для контрольованого навчання (регресія, класифікація) .fit() вимагає як X, так і y. Для неконтрольованого навчання (наприклад, кластеризація) викликається лише .fit(X). Передача y не викликає помилки — цей параметр просто ігнорується.

Під час навчання модель засвоює закономірності, необхідні для прогнозування. Те, що саме засвоюється, і тривалість навчання залежать від алгоритму. Навчання часто є найповільнішою частиною машинного навчання, особливо при роботі з великими наборами даних.

.predict()

Після навчання використовуйте .predict() для отримання прогнозів:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() оцінює навчальну модель, зазвичай на тестовій вибірці:

model.fit(X, y)
model.score(X_test, y_test)

Відбувається порівняння прогнозів із реальними цільовими значеннями. За замовчуванням метрикою є точність для задач класифікації.

Note
Примітка

X_test — це підмножина датасету, відома як тестова вибірка, яка використовується для оцінки якості моделі після навчання. Вона містить ознаки (вхідні дані). y_test — відповідна підмножина істинних міток для X_test. Разом вони дозволяють оцінити, наскільки добре модель прогнозує нові, невідомі дані.

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 1
some-alt