Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Tipos de Dados | Conceitos de Machine Learning
Introdução ao ML com Scikit-learn

bookTipos de Dados

Cada coluna (característica) em um conjunto de treinamento possui um tipo de dado associado. Esses tipos de dados podem ser agrupados em numéricos, categóricos e data e/ou hora.

A maioria dos algoritmos de ML apresenta bom desempenho apenas com dados numéricos, portanto, valores categóricos e de data/hora precisam ser convertidos em números.

Para data e hora, características como 'year', 'month' e similares podem ser extraídas, dependendo da tarefa. Estes já são valores numéricos, então podem ser utilizados diretamente.

Dados categóricos são um pouco mais desafiadores de lidar.

Tipos de Dados Categóricos

Os dados categóricos são classificados em dois tipos:

  • Dados ordinais são um tipo de dado categórico em que as categorias seguem uma ordem natural. Por exemplo, nível de escolaridade (do ensino fundamental ao doutorado) ou avaliações (de muito ruim a muito bom), etc.;

  • Dados nominais são um tipo de dado categórico que não segue uma ordem natural. Por exemplo, nome, gênero, país de origem, etc.

A conversão de dados ordinais e nominais em valores numéricos exige abordagens diferentes, portanto, devem ser tratados separadamente.

Note
Estude Mais

Existem maneiras melhores de converter datas em valores numéricos que estão além do escopo deste curso introdutório. Por exemplo, se utilizarmos apenas a feature 'month', não consideramos que o 12º mês está, na verdade, mais próximo do do que do .

question-icon

Associe a característica ao seu tipo de dado.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Clique ou arraste solte itens e preencha os espaços

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 4

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Awesome!

Completion rate improved to 3.13

bookTipos de Dados

Deslize para mostrar o menu

Cada coluna (característica) em um conjunto de treinamento possui um tipo de dado associado. Esses tipos de dados podem ser agrupados em numéricos, categóricos e data e/ou hora.

A maioria dos algoritmos de ML apresenta bom desempenho apenas com dados numéricos, portanto, valores categóricos e de data/hora precisam ser convertidos em números.

Para data e hora, características como 'year', 'month' e similares podem ser extraídas, dependendo da tarefa. Estes já são valores numéricos, então podem ser utilizados diretamente.

Dados categóricos são um pouco mais desafiadores de lidar.

Tipos de Dados Categóricos

Os dados categóricos são classificados em dois tipos:

  • Dados ordinais são um tipo de dado categórico em que as categorias seguem uma ordem natural. Por exemplo, nível de escolaridade (do ensino fundamental ao doutorado) ou avaliações (de muito ruim a muito bom), etc.;

  • Dados nominais são um tipo de dado categórico que não segue uma ordem natural. Por exemplo, nome, gênero, país de origem, etc.

A conversão de dados ordinais e nominais em valores numéricos exige abordagens diferentes, portanto, devem ser tratados separadamente.

Note
Estude Mais

Existem maneiras melhores de converter datas em valores numéricos que estão além do escopo deste curso introdutório. Por exemplo, se utilizarmos apenas a feature 'month', não consideramos que o 12º mês está, na verdade, mais próximo do do que do .

question-icon

Associe a característica ao seu tipo de dado.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Clique ou arraste solte itens e preencha os espaços

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 4
some-alt