Deslize para mostrar o menu

Os fundamentos do pré-processamento de dados e da construção de pipelines já foram abordados. O próximo passo é a modelagem.

Um modelo no Scikit-learn é um estimador que fornece os métodos .predict() e .score(), além do .fit() herdado de todos os estimadores.

.fit()

Após o pré-processamento dos dados e quando estão prontos para serem usados no modelo, o primeiro passo para construir um modelo é o treinamento do modelo. Isso é feito utilizando o .fit(X, y).

Nota

Para aprendizado supervisionado (regressão, classificação), .fit() requer tanto X quanto y. Para aprendizado não supervisionado (por exemplo, clustering), utiliza-se apenas .fit(X). Passar y não gera erro — ele simplesmente é ignorado.

Durante o treinamento, o modelo aprende padrões necessários para a previsão. O que é aprendido e o tempo de treinamento dependem do algoritmo. O treinamento costuma ser a parte mais lenta do aprendizado de máquina, especialmente com conjuntos de dados grandes.

.predict()

Após o treinamento, utilize .predict() para gerar previsões:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() avalia um modelo treinado, normalmente em um conjunto de teste:

model.fit(X, y)
model.score(X_test, y_test)

Compara as previsões com os valores reais. Por padrão, a métrica é acurácia para classificação.

Nota

X_test refere-se ao subconjunto do conjunto de dados, conhecido como conjunto de teste, utilizado para avaliar o desempenho de um modelo após o treinamento. Ele contém as features (dados de entrada). y_test é o subconjunto correspondente de rótulos verdadeiros para X_test. Juntos, eles avaliam o quão bem o modelo prevê novos dados não vistos.

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 4. Capítulo 1

Pergunte à IA

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Modelos

Os fundamentos do pré-processamento de dados e da construção de pipelines já foram abordados. O próximo passo é a modelagem.

Um modelo no Scikit-learn é um estimador que fornece os métodos .predict() e .score(), além do .fit() herdado de todos os estimadores.

.fit()

Nota

.predict()

Após o treinamento, utilize .predict() para gerar previsões:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() avalia um modelo treinado, normalmente em um conjunto de teste:

model.fit(X, y)
model.score(X_test, y_test)

Compara as previsões com os valores reais. Por padrão, a métrica é acurácia para classificação.

Nota

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 4. Capítulo 1