Завдання: Реалізація Дерева Рішень
У цьому завданні використовується набір даних Titanic, який містить інформацію про пасажирів Титаніка, зокрема їхній вік, стать, розмір сім'ї та інші характеристики. Мета — передбачити, чи вижив пасажир.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Для реалізації дерева рішень можна використати DecisionTreeClassifier з бібліотеки sklearn:
Ваше завдання — побудувати дерево рішень і знайти оптимальні значення max_depth та min_samples_leaf за допомогою перебору по сітці (grid search).
Swipe to start coding
Вам надано датасет Titanic, збережений у змінній DataFrame як df.
- Ініціалізуйте модель Decision Tree та збережіть її у змінній
decision_tree. - Створіть словник для
GridSearchCV, щоб перебирати значення[1, 2, 3, 4, 5, 6, 7]дляmax_depthта[1, 2, 4, 6]дляmin_samples_leaf, і збережіть його у зміннійparam_grid. - Ініціалізуйте та навчіть об'єкт
GridSearchCV, встановіть кількість фолдів на10, і збережіть навчений модель у зміннійgrid_cv.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 4.17
Завдання: Реалізація Дерева Рішень
Свайпніть щоб показати меню
У цьому завданні використовується набір даних Titanic, який містить інформацію про пасажирів Титаніка, зокрема їхній вік, стать, розмір сім'ї та інші характеристики. Мета — передбачити, чи вижив пасажир.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Для реалізації дерева рішень можна використати DecisionTreeClassifier з бібліотеки sklearn:
Ваше завдання — побудувати дерево рішень і знайти оптимальні значення max_depth та min_samples_leaf за допомогою перебору по сітці (grid search).
Swipe to start coding
Вам надано датасет Titanic, збережений у змінній DataFrame як df.
- Ініціалізуйте модель Decision Tree та збережіть її у змінній
decision_tree. - Створіть словник для
GridSearchCV, щоб перебирати значення[1, 2, 3, 4, 5, 6, 7]дляmax_depthта[1, 2, 4, 6]дляmin_samples_leaf, і збережіть його у зміннійparam_grid. - Ініціалізуйте та навчіть об'єкт
GridSearchCV, встановіть кількість фолдів на10, і збережіть навчений модель у зміннійgrid_cv.
Рішення
Дякуємо за ваш відгук!
single