Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Métodos para Codificar os Dados Categóricos | Processamento de Dados Categóricos
Pré-processamento de Dados
course content

Conteúdo do Curso

Pré-processamento de Dados

Pré-processamento de Dados

1. Breve Introdução
2. Processamento de Dados Quantitativos
3. Processamento de Dados Categóricos
4. Processamento de Dados de Séries Temporais
5. Engenharia de Recursos
6. Passando para as Tarefas

book
Métodos para Codificar os Dados Categóricos

Dados categóricos representam um tipo de dado que exprime características qualitativas ou descritivas. Frequentemente são não numéricos. Podem ser marcas de carros, profissões, nível de educação, etc. Mas então, qual é a diferença entre dados de texto simples e dados categóricos? A principal diferença entre dados categóricos e dados de texto é que os dados categóricos são um tipo estruturado de dados com categorias discretas, enquanto os dados de texto são um tipo não estruturado de dados que requerem passos adicionais de pré-processamento para extrair informações relevantes. É por isso que, por exemplo, os nomes das pessoas em um banco de dados com currículos de usuários não são dados categóricos, mas sim dados de texto.

Antes de mais nada, vamos entender porque precisamos codificar os dados categóricos. A maioria dos algoritmos de aprendizado de máquina requer dados de entrada numéricos para que possam realizar seus cálculos, portanto, os dados categóricos precisam ser transformados em uma representação numérica antes de serem utilizados.

Existem muitos métodos de codificação de dados: codificação por rótulos, codificação one-hot, codificação binária, codificação alvo, entre outros, cujas diferenças discutiremos nos capítulos seguintes.

Você pode ver a diferença entre a codificação one-hot e a codificação por rótulos nas imagens abaixo:

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 1
We're sorry to hear that something went wrong. What happened?
some-alt