Desafio: Saco de Palavras
Tarefa
Swipe to start coding
Você possui um corpus de texto armazenado na variável corpus
. Sua tarefa é exibir o vetor para o bigrama 'graphic design' em um modelo BoW. Para isso:
- Importe a classe
CountVectorizer
para criar um modelo BoW. - Instancie a classe
CountVectorizer
comocount_vectorizer
, configurando-a para um modelo baseado em frequência que inclua tanto unigramas quanto bigramas. - Utilize o método apropriado de
count_vectorizer
para gerar uma matriz BoW a partir da coluna'Document'
emcorpus
e armazene o resultado embow_matrix
. - Converta
bow_matrix
para um array denso e crie umDataFrame
a partir dele, definindo as características únicas (unigramas e bigramas) como colunas. Armazene o resultado na variávelbow_df
. - Exiba o vetor para o bigrama
'graphic design'
como um array.
Solução
Tudo estava claro?
Obrigado pelo seu feedback!
Seção 3. Capítulo 5
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 3.45
Desafio: Saco de Palavras
Deslize para mostrar o menu
Tarefa
Swipe to start coding
Você possui um corpus de texto armazenado na variável corpus
. Sua tarefa é exibir o vetor para o bigrama 'graphic design' em um modelo BoW. Para isso:
- Importe a classe
CountVectorizer
para criar um modelo BoW. - Instancie a classe
CountVectorizer
comocount_vectorizer
, configurando-a para um modelo baseado em frequência que inclua tanto unigramas quanto bigramas. - Utilize o método apropriado de
count_vectorizer
para gerar uma matriz BoW a partir da coluna'Document'
emcorpus
e armazene o resultado embow_matrix
. - Converta
bow_matrix
para um array denso e crie umDataFrame
a partir dele, definindo as características únicas (unigramas e bigramas) como colunas. Armazene o resultado na variávelbow_df
. - Exiba o vetor para o bigrama
'graphic design'
como um array.
Solução
Tudo estava claro?
Obrigado pelo seu feedback!
Seção 3. Capítulo 5
single