Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda O Que Faremos com os Valores NaN? | Pré-processamento de Dados
Técnicas Avançadas em Pandas

bookO Que Faremos com os Valores NaN?

No capítulo anterior, você recebeu o seguinte resultado:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

O conjunto de dados possui 418 linhas. Observe a coluna Cabin, onde temos 327 valores ausentes. Não faz sentido preenchê-los, pois temos informações mínimas aqui. Portanto, neste caso, a melhor solução é excluir a coluna que não é útil para nós. Um dos motivos é que poderíamos excluir apenas as linhas que contêm valores ausentes, mas não podemos excluir 327 linhas de 418. Então, vamos entender como fazer isso.

Para excluir uma coluna, é necessário aplicar o método .drop() ao conjunto de dados. A sintaxe é a seguinte:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Explicação:

  • .drop() - método que exclui colunas;
  • columns = 'column_name' ou columns = ['column_1', 'column_2'] - argumento da função, onde você especifica o nome ou os nomes das colunas que deseja excluir;
  • inplace = True - argumento útil do pandas que permite salvar todas as alterações. Você pode utilizá-lo em outras funções também; veremos algumas delas mais adiante.
Tarefa

Swipe to start coding

Sua tarefa é excluir a coluna com o maior número de valores NaN. Siga o algoritmo:

  1. Exclua a coluna 'Cabin' utilizando o argumento inplace = True.
  2. Exiba 5 linhas aleatórias do conjunto de dados.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 5. Capítulo 3
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Suggested prompts:

Can you explain what happens if I don't use `inplace=True`?

What should I do if I want to delete multiple columns at once?

Is there a way to undo the column deletion if I make a mistake?

close

Awesome!

Completion rate improved to 3.03

bookO Que Faremos com os Valores NaN?

Deslize para mostrar o menu

No capítulo anterior, você recebeu o seguinte resultado:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

O conjunto de dados possui 418 linhas. Observe a coluna Cabin, onde temos 327 valores ausentes. Não faz sentido preenchê-los, pois temos informações mínimas aqui. Portanto, neste caso, a melhor solução é excluir a coluna que não é útil para nós. Um dos motivos é que poderíamos excluir apenas as linhas que contêm valores ausentes, mas não podemos excluir 327 linhas de 418. Então, vamos entender como fazer isso.

Para excluir uma coluna, é necessário aplicar o método .drop() ao conjunto de dados. A sintaxe é a seguinte:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Explicação:

  • .drop() - método que exclui colunas;
  • columns = 'column_name' ou columns = ['column_1', 'column_2'] - argumento da função, onde você especifica o nome ou os nomes das colunas que deseja excluir;
  • inplace = True - argumento útil do pandas que permite salvar todas as alterações. Você pode utilizá-lo em outras funções também; veremos algumas delas mais adiante.
Tarefa

Swipe to start coding

Sua tarefa é excluir a coluna com o maior número de valores NaN. Siga o algoritmo:

  1. Exclua a coluna 'Cabin' utilizando o argumento inplace = True.
  2. Exiba 5 linhas aleatórias do conjunto de dados.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 5. Capítulo 3
single

single

some-alt