Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio: Saco de Palavras | Modelos Básicos de Texto
Introdução ao PLN

bookDesafio: Saco de Palavras

Tarefa

Swipe to start coding

Você possui um corpus de texto armazenado na variável corpus. Sua tarefa é exibir o vetor para o bigrama 'graphic design' em um modelo BoW. Para isso:

  1. Importe a classe CountVectorizer para criar um modelo BoW.
  2. Instancie a classe CountVectorizer como count_vectorizer, configurando-a para um modelo baseado em frequência que inclua tanto unigramas quanto bigramas.
  3. Utilize o método apropriado de count_vectorizer para gerar uma matriz BoW a partir da coluna 'Document' em corpus e armazene o resultado em bow_matrix.
  4. Converta bow_matrix para um array denso e crie um DataFrame a partir dele, definindo as características únicas (unigramas e bigramas) como colunas. Armazene o resultado na variável bow_df.
  5. Exiba o vetor para o bigrama 'graphic design' como um array.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 5
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

close

Awesome!

Completion rate improved to 3.45

bookDesafio: Saco de Palavras

Deslize para mostrar o menu

Tarefa

Swipe to start coding

Você possui um corpus de texto armazenado na variável corpus. Sua tarefa é exibir o vetor para o bigrama 'graphic design' em um modelo BoW. Para isso:

  1. Importe a classe CountVectorizer para criar um modelo BoW.
  2. Instancie a classe CountVectorizer como count_vectorizer, configurando-a para um modelo baseado em frequência que inclua tanto unigramas quanto bigramas.
  3. Utilize o método apropriado de count_vectorizer para gerar uma matriz BoW a partir da coluna 'Document' em corpus e armazene o resultado em bow_matrix.
  4. Converta bow_matrix para um array denso e crie um DataFrame a partir dele, definindo as características únicas (unigramas e bigramas) como colunas. Armazene o resultado na variável bow_df.
  5. Exiba o vetor para o bigrama 'graphic design' como um array.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 5
single

single

some-alt