Tipos de Dados
Cada coluna (característica) em um conjunto de treinamento possui um tipo de dado associado. Esses tipos de dados podem ser agrupados em numéricos, categóricos e data e/ou hora.
A maioria dos algoritmos de ML apresenta bom desempenho apenas com dados numéricos, portanto, valores categóricos e de data/hora precisam ser convertidos em números.
Para data e hora, características como 'year'
, 'month'
e similares podem ser extraídas, dependendo da tarefa. Estes já são valores numéricos, então podem ser utilizados diretamente.
Dados categóricos são um pouco mais desafiadores de lidar.
Tipos de Dados Categóricos
Os dados categóricos são classificados em dois tipos:
-
Dados ordinais são um tipo de dado categórico em que as categorias seguem uma ordem natural. Por exemplo, nível de escolaridade (do ensino fundamental ao doutorado) ou avaliações (de muito ruim a muito bom), etc.;
-
Dados nominais são um tipo de dado categórico que não segue uma ordem natural. Por exemplo, nome, gênero, país de origem, etc.
A conversão de dados ordinais e nominais em valores numéricos exige abordagens diferentes, portanto, devem ser tratados separadamente.
Existem maneiras melhores de converter datas em valores numéricos que estão além do escopo deste curso introdutório. Por exemplo, se utilizarmos apenas a feature 'month'
, não consideramos que o 12º mês está, na verdade, mais próximo do 1º do que do 9º.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 3.13
Tipos de Dados
Deslize para mostrar o menu
Cada coluna (característica) em um conjunto de treinamento possui um tipo de dado associado. Esses tipos de dados podem ser agrupados em numéricos, categóricos e data e/ou hora.
A maioria dos algoritmos de ML apresenta bom desempenho apenas com dados numéricos, portanto, valores categóricos e de data/hora precisam ser convertidos em números.
Para data e hora, características como 'year'
, 'month'
e similares podem ser extraídas, dependendo da tarefa. Estes já são valores numéricos, então podem ser utilizados diretamente.
Dados categóricos são um pouco mais desafiadores de lidar.
Tipos de Dados Categóricos
Os dados categóricos são classificados em dois tipos:
-
Dados ordinais são um tipo de dado categórico em que as categorias seguem uma ordem natural. Por exemplo, nível de escolaridade (do ensino fundamental ao doutorado) ou avaliações (de muito ruim a muito bom), etc.;
-
Dados nominais são um tipo de dado categórico que não segue uma ordem natural. Por exemplo, nome, gênero, país de origem, etc.
A conversão de dados ordinais e nominais em valores numéricos exige abordagens diferentes, portanto, devem ser tratados separadamente.
Existem maneiras melhores de converter datas em valores numéricos que estão além do escopo deste curso introdutório. Por exemplo, se utilizarmos apenas a feature 'month'
, não consideramos que o 12º mês está, na verdade, mais próximo do 1º do que do 9º.
Obrigado pelo seu feedback!